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نشر ثورندايك عام 1904 مؤلفه مدخل إلى نظرية القیاس العقلي والاجتماعي والذي 
یمد آول کتاب منهجي في نظرية القیاس. وقد رحب بهذا العمل بحماس کبیر من هيل 
زملاثه والمختصين في الجال نفسه. وبعدها وخلال فترة وجيزة أصبحت دراسة dy plas‏ 
القیاس مقرر امتاس من منهج الدراسات العلیا في کل من التربية وعلم النفس. وعبر 
العقود الستة التالية اتسعت نجاحات العلماء ونقحت وأضيفت إلى هیکل النظرية التي 
وصفها ثورندايك. وهذا الهیکل الجتمع من العرفة عرف باسم نظرية القیاس التقليدية, 
وهنه قدمت لتا الأساس النظري تتطویر معظم مقاییس الاستعداد والتحصیل والشخصية 
والميول الستخدمة في القرن العشرین. وتقدمت نظرية القیاس في العشرین سنة الأخيرة 
بشکل سریع جعل من الستحیل تدوین کل تقدمها في الکتب القررة التقليدية. ویعزی هذا 
التقدم العرفي في جزء منه إلى تطور التقنیات الحوسبية التي جعلت من المکن تطبیق 
نماذج رياضية ولحصائية ST‏ تعقیداً لدرجات الاختبارات. وبازدیاد suc‏ الختصین ی 
القیاس السيكومتري والحاجة إلى القیاس الوضوعي للطلبة والسترشدین ثم الاستفادة 
من ذخيرة الخدمات العامة والبرامج التربوية التي ساهمت في هذا الجال. وتبعا لذلك 
فان تقحص محتوی مجلات القیاس الرائدة في التربية وعلم النفس توحي بأن العدید من 
الوضوعات السائدة حديثة في أساسها . 

ومن ALAM‏ على مثل هذه انوضوعات طرائق تطویر اختبارات محكية المرجع: ونظرية 
الاستجابة للفقرة ونظرية إمكانية التعميم والطرائق السيكومترية المتبعة في الكشف عن 
تحيز الفقرات الاختبارية. ومن منطلق هذا التطور فان المعرفة بنظرية القياس التقليدية 
لم تعد كافية لإعداد طلبة الدراسات العليا أو المختصين في القياس؛ بل إن الحاجة ملحة 
للاطلاع علی الدراسات الحديقة في هذا الجال وتطبیق العلومات التضمنة فى هذة 
الدراسات. ۱ 

ان Alle‏ نظرية انقیاس الحدبثة یجب of‏ یکتسیوا معرفة اساسیة بالشیاس السیکومتري 
التقليدي إضافة إلى أنه يجب أن تکون لدیهم القدرة على دمج آفکار جديدة إلى هیکل 
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العرفة. وقد وضع هذا الكتاب ليساعد القارئ في اكتساب هذه الأمور؛ والقارئ الذي 
يأمل أن يجد سلسلة خطوات متتابعة لإجراء أي عملية من خلال النقاش التقني للرموز 
الاحصائية سیخیب امله. وقد بينا ان الطرائق الافضل او الموصى بها بدرجة اکبر لاي من 
مظاهر تطوير القياس قد تتغير كلما ظهرت وتأسست أفكار ونتائج تجريبية جديدة. لذا 
على طلبة القياس ان يكتسبوا بعض المراس في قراءة المحتوى الذي يتضمن المصطلحات 
والرموز التقنية المشابهة لما سيحتاجونه عندما ينخرطون في سلك الدراسات العليا والبدء 
بالقراءة المتخصصة لادبيات القياس وباستقلالية . وفي الوفت نفسه فنحن مقتنعون بان 
العدید من القراء لیس تیم اکثر من مساق مدخلي في الاحصاء. لذا فان التعییرات 
الكمية اتبعت بالتفسیر اللفظي والذي نأمل ان لا يبدو مسهبا أو مملاً للقارئین ذوي 
الخلفية الجيدة. وتتطلب العالجة الدقيقة او الناسبة في بعض الاحیان محتوی یفوق 
الطرائق الا حصائية المدخلية (علی سبیل المثال محتوی کل من نظرية امكانية التعمیم 
ونظرية الاستجابة للفقرة). وفي مثل هذه الحالات فانه من الأهمية بمکان دراسة هذا 
بدلا من |همالها أو حذفها حتی تصبح بسيطة, لذا فان القارئین الذين لدیهم القلیل من 
الخبرة في هذا الوضوع علیهم استخدام هذه الطرائق او تفسير نتاجاتها ونتائجها. 

وقد نظمت الادة التعليمية في هذا الکتاب ضمن خمس وحدات هي: مدخل الى نظرية 
القیاس, والثبات والصدق, وتحلیل الفقرة في تطویر الاختبار. وتصحیح الاختبار وتفسیر 
درجاته. وتعرض الوحدة الاولی معلومات اساسية مع تدریبات بسيطة في القیاس 
والاحصاء. وکل وحدة من الوحدات التالية تعرض طريقة القیاس التقليدية في الفصول 
الاولی. وعرضت معلومات اکثر حداثة في الفصول التالية مع مناقشة لكيفية ربط هذه 
الطرائق بالفاهیم التقليدية. عموماًء فان التطورات الحديثة في معظم مجالات نظرية 
القیاس تتطلب معالجات اکثر تعقيدا. لذا فان فصول كل وحدة مرتبة من الاسهل الى 
الاصعب والاگثر تعقيداً من حيث الحتوی في الوضوع الواحد. وعلی الدرسین والشرفین 
الذي يعينون قراءات معينة لطلبتهم ان یتتبهوا الى ان الجزء الاخیر في معظم الفصول 
يمكن حذفها او تعیینها للقراءات الاضافية الاختيارية دون فقدان الاستمرارية مع محتوی 
الوحدات التالية. وان كانت الرغبة محصورة في نظرية القیاس التقليدية فیمکن الحصول 
علیها في الفصول من الاول حتی السایع والعاشر والرابع عشر والسایع عشر والتاسع 
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عشر. ويمكن sles!‏ مقدمة عن الموضوعات السيكومترية الحديثة ولن لديهم خلفية عن 
نظرية القياس التقليدية في الفصول الثامن والتاسع والخامس عشر والسادس عشر 
والثامن عشر والعشرون. هذا وتعد التمارين الحسابية والاسئلة المبينة في نهاية JS‏ فصل 
جزء مکمل لهذا الكتاب: فقد طورت خصیصاً لتوضیح تطبیقات الفاهیم الاساسية البينة 
في الفصل وتوفر للقارئ فرصة الاستخدام النشط لتطبیق نظرية القیاس في مشکلات 
القیاس الحالية. ویوفر الملحق ب اجابات على العدید من التمارین الحسابية. 

ان تأليف کتاب منهجي يعد (LE Wee‏ ومثبطاً للعزيمة ومذلاً لکنه يغني مؤلفه بخبرة 
غنية. ومن مصادر تثبيط العزيمة هو عدم كفاية معرفتنا الخاصة وقدراتنا الحدودة في 
النواحي المنطقية والحسابية والاخطاء القواعدية في التنظیم والتبسیط والترجمة الدقيقة 
لافکار الاخرین في عمل بيداغوجي متکامل. وتتأتی مكافئة هذا الجهد من اعطائها 
الفرصة لدراسة الاعمال الاصيلة للعديد من الزملاء الاساتذة في الجال ومن الدعم 
الخلص الاصیل من جهات عديدة. ونحن مدینین في مولفنا هذا لطلبة نظرية القیأس في 
جامعة فلوريدا الذين شجعوا هذا العمل مع تقدیمهم لاقتراحات بناءة لخطوطة الکتاب في 
وقت اعدادها وتطویرها بالاضافة الى مساعدتهم في مراجعة واعداد تمارین نهاية 
الفصول. كذلك تلقینا ملاحظات ومقترحات وزودنا بمراجع مفيدة من قبل العدید من 
الؤماؤء A‏ زیم E‏ وا الشقلوطة الاونية وكين هوشر مات ایو 
هذا بالاضافة الى جهود القائمین على طباعة واخراج هذا الکتاب وهم هيئة التحریر في 
Holt, Rinehart Swinstor‏ وکانت جهودهم كبيرة. ويعد هذا العمل Lalas EPRE‏ 
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' الحمد لله الذي هوانا لهذا وما كنا لنهتدي لولا أن هدانا الله " وأصلي وأسلم على 
سيد الرسلین البعوث رحمة للعالمين ومن تبعه بإحسان إلى يوم الدین. ۱ 

فقد من الله (le‏ ووفقني لترجمة هذا الكتاب " نظرية القياس التقليدية والمعاصرة E‏ 
والدي يعد من الراجع الأمساسية في القياس النفسي والتربوي والذي لا يستغني عنه 
الملتخصصين في مجال القیاس. ٠‏ ۱ 

تفن هذا الكتاب نظريات القياس الأساسية الثلاث: نظرية القياس التقليدية ونظرية 
التعميم (نظرية اتخاد القرار) ونظریة السمة الکامنة بتماذجها الأساسية ویتضمن دا 
الفا الخلفية النظرية والخطوات النهجية والاستخدامات العملية والتطبیقات مع آمظة 
متنوعة من أدبيات القیاس, مغ الموازنة بين تطبيقات نماذج هذه النظريات وفق أسس 
نظرية رياضية وتطبيقية. 

وأسأل الله العليّ القدير أن يتقبل هذا العمل المتواضع وأن يكون خالصاً لوجهه الکویم..: 
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الفصل الاول 

أي شيء می‌جود فانه موجود بمقدارء ولعرفته يصورة شاملة اعرف يعدي EE‏ إلى 
.(Thorandike, 1918) ise 93‏ 

چ ما هی نظرية القياس ولماذا نحتاجها؟ 

Lon‏ الاختلاف بن تعلم تطبیق اختبار عن استخدام اختبارات بعینها؟ 

کف فرط نوی لاش تخس انت وا اه 

يجيب هذا الفصل جرئیاً على الأقل عن مثل هذه الأسئلة؛ وفی الأجزاء التالية سنحدد 
المفاهيم الأساسية, وسخصف مشكلات معينة تواجهنا فى قيأس الأبنية النفسية, وتفسیر 
الهدف الواسع لنظرية القياس بالنسبة لشکلات مثل هذهء ومراجعة الأصول التاريخية لهذا 
الميسدان» THR Ge a‏ الفروق CAS‏ نظرية القیاس والظاهر الأخرى لأبحاث د 


aa‏ الحاجة إلى نظرية القياسء من الضروري أولاً فهم بعض الأمور حول الطبيعة 
الأساسية ؛ للقياس؛ والابنية والاختیارات النفسبة. . وقد واصف ويتز مشک فرأ )1951 (Weitznhooffer,‏ 





slated ack‏ بر بالارقام للاشياء Sy‏ وا يس 

1 ع مریف ستیفنز وأضافوا 
ان القياس يكون لخصائص لاقني ATT‏ نفسها. . فعندما يقيس عالم الكيمياء الفيزيائية 
ال ا کرکب أو ates‏ عالم Saal‏ عند البكتيريا في نقطة cole‏ فإن هذه تعد قياسات 
لخصائص معينة للأشياء التي تم قياسها. وبصورة مماثلة, فان alle‏ النفس لا يقيس الطفل 
وإكنه يقيس صفات طبيعية معينة مثل الطول أو الوزن أو خصيصة نفسية مثل تطور BURI‏ 
i‏ النضج الإجتماعي أو عملية الجمع الأساسية, وغرف . عرف علم النفس -تقليدياً- على أنه دراسة 
السلوك والخصائص التي تُميز الفرد في المنزل والعمل والمدرسة والمواقف الاجتماعية. وهذه 
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يطلق عليها اسم الخصائص النفسية (آو السمات النفسية) وعلى عكس الخصائص 
الفيزيائية فان الخصائص النفسية للفرد لا يمكن قياسها مباشرة كما هو الحال في قياس 
الوزن آو الطول. فالخصائص النفسية عبارة عن EMT‏ إنها Gat‏ افتراضية -نتاج لما كوته 
الحيال العلمي لعلماء الاجتماع الذين حاولوا تطوير نظريات تفسر سلوك الإنسان. ولا يمكن 
اثبات وجود مثل هذه الأبنية على الاطلاق, وعلى العكس فان الدرجة التي تميز الخصيصة 
النفسية عند فرد ما يمكن استنتاجها -فقطك من الملاحظات السلوكية لهذا القَرد. 7 
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Ges‏ نطرج المثال التالي: عملية تكوين البناء وكيف يؤدي إلى قياس الخصائص. افترض 

أن عالم نفس تطوري يعمل مع أطفال ما قبل المدرسة ولاحظ من خلال أنشطة اللعب المتعددة 
بأن بعض الأطفال يحاولون وبصورة متكررة توجيه نشاط الآخرين. ويعد ملاحظة هذا النوع 

من السلوك المتسق عبر الزمن وخلال سياقات عديدة لمجموعة الأطفال نفسهاء فإن عالم 
النفس ان يبدأ بتسمية مثل هذه السلوكات على أنها «السيطرة الإجتماعية» وعالم النفس هذا 
ابتكر بناءاً نظرياً يشمل عدداً من السلوكات المتشابهةء ولكن ابتکار البناء لا يكون مشابهاً 
لقياس البناء نفسه. فقبل إجراء آي قياس البناء؛ من الضروري تكوين بعض قوانین التطابق 
بين البناء النظري والسلوكات الملاحظة التي تعد مؤشرات منطقية لهذا البناء» وتسمى هذه 
العملية تكوين أو تاستیش التعريف الاجرائي للبناء. وفي مثالنا لقياس السيطرة الاجتماعية؛ 
يجب ان#يحيد عالم النفس أنواع سلوكات أطفال ما قبل الدرسة التي يمكن یا ليع 
اعتباره «مسيطراًء وبعدها عليه أن يقترح خطة للحصول على مثل هذه السلوكات في مواقف 
معيارية» وتسجيل ملاحظات - كل طفل يصيغة معيارية. any:‏ يتطلب تطوير pie‏ آو آختیار 
للبتاء الذي يعرف بالسيطرة الاجتماعية. A,‏ هام يكن sad‏ الاختبار على أنه طريقة 
شا عينة من السلوك في مجال معين. كذلك فإن هذا الكتاب سيستخدم 
مصطلح الاختبار ليشير إلى الطرائق ق المتبعة للحصول على عينة آقصی أداء للفرد (كما هو 
الحال في اختبارات الإستعداد والتحصيل حيث يطلب من المفحوص تقديم أفضل ما لديه) أو 
الأداء المميز للفرد LS)‏ هو الحال في الاستبانات أو المقابلات حيث يكتب المستجيب مشاعره 
وإتجاهاته وميوله وتفاعله مع الواقف المميزة). وأسلوب آخر في الحصول على عينة أداء مميز 
هو قائمة معيارية ية وقائمة بالسلوكات التي يمكن أن يستخدمها الملاحظ ويسجل فيها سلوكات 
الفرد في مواقف طبيعية. وعندما يعد عالم النفس قائمة يسلوكات ليتم فحصها أو تقديرها من 
قبل ملاحظين حسب خطة محددة مسيقاً: . وعندما يضع الكيميائي مجموعة فقرات اختيار من 
متعدد لمستوى نشاط العناصر في الجدول الدوريء وعندما يُقّدر المرشد النفسي درجة القلق 
التي يشعر بها السترشد في المواقف الاجتماعية, فكل واحد من هؤلاء يقترح اختباراً في 

















الجال الواسع لهذه الكلمةء ونحن سنستخدم هذا المصطلح بالطريقة نفسها. 


ولي اش PN a‏ ات ما ی O‏ کی مولن خاش قراس 
اختبار. دث القياس عندما يخبر alle‏ النفس بعدد مرات السيطرة 
الاجتماعية من خلال قائمة ات ليور السلوك خلال فقرة حمس دقائق bata sy]‏ 


يعد الكيميائى عدد الفقرات التى "E‏ الطالب tite‏ هت مدل زوك ویو 
قياسات كهذه لسلوكات ملاحظة يكوّن مطور الإختبار إستدلالاً حول كمية البناء النظري والتي 
تميز فرداً بعینه. l‏ 
لماذا يحاول التريويون والنفسيون قياس أبنية لايمكن ملاحظتها مباشرة؟ في التربية وعلم 
call‏ وة البناء بطربقا فعالة زملاشه اتف عون فخ الماك تا لهات دون هال 
هذه الأبنية التي تستخدم في وصف سلوكات الأفراد الذرية وتصنيفهاء فإن معظم المحاولات 
ES‏ الكلواهر الستاوكية Sokal‏ تدرب فى التشويش والعموكن: خد مكلا الدى الزاسم 
من الکلمات والأفعال والتفاعلات التي يمكن أن تظهر في يوم واحد في صف دراسي واحد. 
فقد يكون کرونباخ )1969 (Cronbach,‏ قدر هذه الحالة عندما أكد على أن دراسة الأنشطة 
الصفية هي على الأقل بصعوية دراسة الاعصار. والملاحظ الذي يحاول تسجيل ووصف 
أفعال كل فرد في هذا الوقف سيرتبك فورأ؛ علاوة على أن أي محاولة للتنبق أو ضبط أو 
تحديد مسبب كل سلوك منفصلاً عن غيره سيكون بلا أمل أيضاً. ويمكن للملاحظ من خلال 
استخدامه للأبنية أن يبدأ بتصنيف وتجميع السلوكات المتشابهة ثم وصفها بمصطلحات 
مطابقة لخصائصها. وتعد مثل هذه الأبنية اللبنات الأساسية فى بناء النظريات حول السلوك 
one an‏ الستوی الابسط فان ال ee‏ الممكئة بين 





معينة أى ضيطها . ولتحقيق هذا الهدفء؛ فمن i‏ نیم الملاحظات السلوكية التي تمثل تمثل 
الأبنية الت وضعها النظرون 
EES‏ ل 
مشكلات في قياس الأينية النفسية: 
ov‏ الأينية النفسية مجردة وتقّیم سفق بصورة غير مبأشرة. فإن تصميم أدوات لقياسها 
pacts‏ مشکلات عة افترهن على ستعيل الال افدر الرخبة فى قياس الأبقية الخاضية 
بالواقف الثلاثة الموضحة أدتاه: 
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3. معلم الصف الخامس پرید تظوين اختبار اقیاس مهارات القسمة الطويلة. 
القسبة الطويلة که مان ان و AS)‏ تمس اكه زاس oN Bs‏ القناسشنة علي 
الاقل. وهي شائعة في القیاسات النفسية كافة. 












8 سه اس ا pet‏ من سارک دی 
البناء ak‏ . دعنا ثأخذ على سبيل المثال تطوير إختبار قياس مهارة الطلاب في 
اس الطويلة. وحيث أنه لا يمكن لأحدنا أن ينظر إلى رأس الطالب ويرى كم يعرف 
عن الضف اا فان شون الاخذیار هبت بعض الساوکات الذي ينك أن یجریها 
الطلبة لیستدل منها عن مدی معرفتهم للموضوع. ولحدی الطرق هو تکلیف الطالب 
بحل عدد من المسائل التعلقة بالقسمة الطويلةء وطريقة ثانية هي سوالهم عن وصف 
الخطوات المتسلسلة الستخدمة في عملية القسمة الطويلة. وطريقة BUG‏ هي سؤالهم عن 
اکتشاف الاخطاء في مسالة قسمة طويلة. من الواضح إذن أن عملیات قياس مختلفة 
gis‏ عن تعریفات إجرائية مختلفة تؤدي بالطبع إلى استنتاجات مختلفة عن مستوی 
معرفة الطلبة 

2. تعتمد القیاسات النفسية على عینات محددة من السلوك. قفي الثال السابق, من 
تحص رك الطلية للمسائل امک حميعها فى القسنه الطريلة والتن يتوقع ان 
یحلها الطالب. لذلك. فان آي محاولة لقیاس الهارات بهذا الجال يجب أن تستخدم 
عينة من هذه المسائل جميعها. ولتوفیر عينة مناسبة من الجال السلوکی, فان تحدید 
عدد الفقرات وتباين الحتوی يعد أمراً حتروریا- 

3 القیاس الناتج مُعرّض للخطا Laity‏ وذلك GY‏ معظم القیاسات النفسية تعتمد بالأساس 
على dire‏ محدودة من اللاحظات وتؤخذ عادة فى وقت واحد فقط. دعنا نعود SLL‏ 
القسمة الطويلة السابق, فإذا تقدم الطلبة للاختبار نفسه مرتین متتالیتین, فمن غير 
te Wa ET‏ اماب تمنو | میت EE‏ لوقف idl‏ راتس 
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والتخمین. وإهمال الإشارات أو نسيانها. وفي حالة تقدمهم لصيغتين CM LIA!‏ 
مختلفتين؛ فمن المحتمل أن لا تتشابه درجاتهم يسبب الاختلاف في المحتوى إضافة إلى 
al gal‏ السالفة الذکر. ومثل عدم التطابق في الدرجات قد يكون بسبب عينة الهام آو 
الأحداث السببة للخطاً. لذلك؛ فان المشكلة القائمة فى القیاس النفسی تکمن فى كيفية 
كسان درجة الخطاً الوجودة في مجموعة اللاحظات آو القیاسات التوافرة. © 

4 عدم وجود وحدات محددة بالضيط على المقياس يؤدي إلى مشكلة آخری. فهل حقيقة أن 
الفحوص الذي لا يستطيع الإجابة على أي فقرة إختبارية في القسمة الطويلة يعني أن 
درجة سيطرته هلى هذه المهارة = صفر؟ وان أجاب سى على )5( فقرات وجو على 
(10) فقرات وستيف على (15) فقرة إجابة صحيحة فل يمكننا الإفتراض أن فرق 
الكفاية بين سو وجو هو الفرق نفسه بين جو وستيف؟ وهل يكون انتشار الطلبة الثلانة 
متساو على متصل القدرة التي يقيسها الاختبار؟ إن تحديد خصائص التدريج. 
واشتقاق وحدات القیاس, وتفسير القيم المشتقة منه تعد LLAS‏ معقدة يجب أن BASS‏ 
بعين الاعتبار عند تطوير LI‏ أداة نفسية واقتراح نظام للتصحيح وإعطاء الدرجات. 

5. لا يجب تحديد الاينية النفسية بصيغة إجرائية فقط ولكن يجب تبيان علاقاتها مع 
الظاهرة آو اللاحظة فإن معناه یکون قلیلاً لو عدیم الفائدة حتی als‏ تفسیره في ضوء 
البناء النظري الذي يقع ضمنه. ولهذا السبب شدّد کل من لورد ونوفيك )1968( على 
آهمية تحدید الأبنية التضمنة في القیاس النفسي على مستویین اثنين هما: 

الاول: كما لاحظناء فإنه یمکن تعریف البناء من خلال السلوك اللاحظ, وهذا النوع من 

التعریف یحدد الكيفية الذى تجري ا اا 

الذاني: یمکن تعریف البناء من خلال العلاقة التطقية أو الرياضية مع الأبنية الأخرى ضمن 

الاطار النظري. وهذا النوع من التعریقات يزودنا بأساس في نفسیر القیاس الناتج. وإن كان 
من غير المکن إثبات مثل هذه العلاقة تجریبیاً فإن القیاس الناتج لا قيمة له. فالحصول على 
ادلة تبین كيقية ارتباط قياس نفسي بقیاس آبنية آخری أو أحداث في العالم الواقعي» یبقی 
التحدي الأساسي في تطویر القیاس. : 











نظرية القیاس على آنها فرع من فروع العرقد. 
تعرف دراسة رمشکلات القیاس السابق ذکرها وحلولها التي ظهرت في العلوم التربوية 
والنفسية باسم نظرية القیاس. ویبحث محتوی مساق في نظرية القیاس اساسا في: 














== 23 


























ا gi‏ تتم باس و ان Veoh Cat cp‏ ال Le‏ توا cot‏ الجا سے و ا مرضمة EA‏ 
n PN oa‏ مرس Cis CVE‏ 
oo nt AIL! 5‏ مرجاسو رامق و اليلد ١‏ 
اتیب SNe‏ تاک لته کر ستو می م تدم CSE GEN‏ 
نات ولمم لقي رججلی ابر بات معطا رج 
ات 
2- اقتراج وسائل أو طرائق التغلب على هذه الشکلات أو تقلیل آثرها. 
إن هدف مساق نظرية القیاس هو مساعدة الطلبة لادراك التماذج النطقية والرياضية التي 
تشكل الأساس في بناء الإختبارات المعيارية وتطبيقاتها. ويؤدي إدراك هذه cial‏ 
وافتراضاتها إلى تطبيقات مطوّرة في اتخاذ القرارات. ومن المهم تمييز نظرية القياس عن 
موضصوع التقييم التربوي والنفسي الاکثر شیوعاً las,‏ > والذي يركز Babe‏ على إدارة 
اختبارات معينة وتفسيرها. بالقابل؛ فان نظرية القیاس تزودنا بهیکل عام یصور عملية تطویر 
الاداة. ا النظرية والطرائق التقليدية التي درس في مساق التي ترس في مساق مثل 
هذ! لا تقذ ی ی مفيدة وبدرجات متساوية في 
والتفسية لها أصولها في الأبحاث الزراعية وذلك عندما يكون pe‏ من الضروري تقييم أثر معالجة 
حاجات القياس التعلقة بمجالات العلوم التربوية والاجتماعية. 
الأصول التاريخية: 
بتماشی التطور التاريخي لنظرية القیاس مع تطور علم النفس كفرع من فروع المعرفة 
العلمية. وظهرت النظرية من خلال جهور علماء النفس فى آوروپا والولایات التحدة إذ درسوا 
الشکلات dogs Sil‏ والنفسية التنوعة. وفی هذا الجزء سنذکر باختصار مساهمة بعض الأفراد 
الذین ساهمت جهودهم في تقدیم نظرية القیاس وتطبیقاتها. 
jail‏ واللاحظات غير النهجية. وكتب شوندت Ta‏ )1873 07 يمك الثورة 
المحاولة». ومع أن قياس القدرات العقلية توسع من خلال قياس زمن الرجع والتمييز الحسي 
مختبرات الإدراك الالانية. وتبدو شرعية جميع الملاحظات السلوكية تحت شروط محددة - 
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مخ التعریف العام للقیاس. 
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قیاس السمات العقلية. وبعکس الالان انصب اهتمامهم على دراسة الفروق الق ومن‎ 
آشهر هؤلاء فرنسیس جالتون الذي تأثرت آفکاره تأثراً واضحاً بتفکیر خاله شارلس دارون‎ 

ولي eels‏ واه ی AP LIR Gow‏ ار تیگ مان 
الیوم. فمثلاً وض في احدی مقالاته بعض التطبیقات غير الرسمية مثل عدد الاشياء التي 
کی asst‏ عتما کاخ يتحول فين البرك مول ( مرک تجار كنس ff‏ ا شام 
حیوانات يجغل أو يُروّع عند سماعه صفارة عالية مخفية فى مقبض عصا )1883 (Galton,‏ 
وقد سجل أيضاً قياسات كمية مفصلة للخصائص النفسية للأفراد في مختبر الأنتروبولوجيا 
ویعد استخدام التطبیقات والتقنیات الاحصائية للبیانات الستمدة من الاختبارات النفسية 
مساهمته الرئيسية في مجال نظرية القیاس. وقد استخدم فى plo‏ 1869 درجات اختبار 
الاد اة ا مبردج مميعيم رد رجات یشان القبول للكلية اة ةد 
[ثباته آن القدرات العقلية تتوزع اعتدالیاً علی day‏ التقريب. وبعد ذلك العشرین Lele‏ غل 
مبهوراً بطبيعة الفروق الفردية وقد کتب مقالة اقترح فیها استخدام الطرائق الارتباطية في 
اختبار التباین الشترك بين سمتين آو آکثر )1948 (Dennis,‏ وقد طور الإحصائي البريطاني 
کارل بیرشون صيغة إحصائية Jalal‏ الارتباط تعتمد على هذا الاقتراح. وتبعه علماء آخرون 
ساروا على النهج نفسه. والأكثر شهرة بين هؤلاء هو شارلس سبیرمان بنظریته العروفة عن 
الذكاء والتي تعتمد على طريقة إرتباطية أكثر تطوراً تسمی التحلیل العاملي. وبقیت الطرائق 
EN‏ راخ المانای تفای الا نیوا واا فن chia)‏ یت 
الإختبارات. ١‏ ۱ 

فرنسا: علی الرغم من ٍسهامات ا الالنیّین والبریطانین الهمة السايقة, الا آن 
[نجاز الفرنسیین الفرد بینیه وثيوفيل سیمون )1908-1905( GSAT‏ نقلا دراسة الاختبار العقلی 
من تدریب آكاديمي إلى مغامرة آصبع لها تطبیقات فورية في غرفة الصفء وفي العیادات 
النفسية؛ وفي آماکن العمل. فقد آخذ هذان الحللان النفسيّان على عاتقهما للهمة العملية في 
|بتکار طريقة تفید في تحدید الضعف العقلي عند آطفال الدارس العامة. وکانت النتيجة رائعة 
في قياس السمة التي تعرف بشکل عام باسم «الذكاء» ومع أن شهرة بينية كانت يسبب 
اختبار الذكاء الذي ما زال يحمل اسمهء إلا أنه A‏ تأثيراً Lage‏ في نظرية القياس وذلك في 
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E es‏ من كلال SAN‏ الدقيقة التي ترافق الاختبارات القننة الحديثة, فمثل هذه مر 


التعلیمات تشحدد الشروط المعيارية لجمع البيانات ونظام التصحيح وجعل هذة الدرجات تتطايق 1 
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إنشائه لطريقة عملية في بناء الاختبار وتصديقه. وحتى إختراق بينية الطريقة الشائعة المتبعة 
في بناء الإختبار والتي هي تجميع فقرات بناءاً على منطق نظري ومن ثم إستخدامهاء ففي 
عام (1905) رفض بينية هذا الأسلوب وسماه بالعمل السلي (المضحك) مقارنة بالإستيطان 
ويناء المستعمرة فى الجزائر بالإعتماد على الخريطة فقط ودون معرفة العنوان. فطريقة بينية 
الجادة تتطلب تحديد سلسلة من الهام التي تميز بين الأطفال من الفئات العمرية المختلفة وعبر 
التطور المتسلسلء وقد تم تطبيق مئات الفقرات على اعداد كبيرة من الأطفال اختير من بينها 
الفقرات التي مَيّزت جيداً بين الاطفال, وبعد ذلك قام بينية وسیمون بتجميع مهام متنوعة لكل . 
مستوى عمري» ويؤديها معظم أطفال ذلك المستوى بنجاح, فمثلاً: 
في عمر 3 سنوات: يؤشر إلى العین, الأنف, الفم. 
في عمر 7 سنوات: يشير إلى المحذوف في صورة. يكرر خمسة أشكال رآها. 
وفي عمر 1 ain‏ ينتقد الجمل التي تحوي تناقضات. 
ومن الأداء على الفقرات اشتق بينية تقديراً للعمر العقلي للمفحوص مقارنة بالعمر الزمني 
له, وذلك لتحدید الکان الناسب له فى المواقف التدريسية أو في المؤسسات الخاصة بالمعاقين. 
واضافة إلى تأسيس بينية لعملية التحلیل الأولي للفقرات فإننا ندين له في تطویره لفهوم 
العاییر التی تعد مرشداً Lage‏ فى تفسير الدرجات ویعد تقديراً لجهود بينية وبراعته أن 
الصيغة الحالية لاختبار ستانفورد - بینیه للذکاء لا تزال تشبه بصورة ملحوظة الصورة 
الاصلية للاختبار التي بنیت أصلاً لأطفال الدارس في باریس )1975 (Thorndike,‏ ومن الهم 
ملاحظة أن تحليل الفقرات وإعداد العاییر. وعلى الرغم من التقنيات؛ فإنها تشبه كثيرأ طريقة 
بينية التي أسسها في مطلع هذا القرن. 
الولایات المتحدة: مع أن اهتمام التربویّن الأمريكان للمشكلات النفسية كان منذ مطلع 
0م إلا أنهم لم يبدأوا بتوفير طرق قياس متميزة حتى بداية القرن العشرين. فمثلاً يعود 
الفضل إلى جيمس كاتل بابتكار مصطلح الإختبار العقلي وذلك في مقالة كتبها عام 1890م. 
فقد شدد فى كتاباته فى تلك الفترة على أهمية اختيار عينات اختبارية كبيرة وذلك للحصول 
على تقديرات طبيعية دقيقة, ويصر كذلك على أن ple‏ النفس يجب أن يدرس طبيعة أخطاء 
الملاحظة )1933 «Boynton,‏ مع العلم بأن الاختبارات التي وصفها كاتل هي نفس حركية أو 
إدراكية وتشبه كثيراً تلك المستخدمة من قبل علماء النفس التجريبي الألان. وألف ثورندايك 
عام 1904 أول كتاب في نظرية القياس: «مقدمة في نظرية القياس العقلي والاجتماعي» وكان 
غير متاگرمن ردود أفعال زملائه. وقدم نسخة منه إلى زميله وليم جيمس مع الملاحظة ASH‏ 
:(Joncich, 1968, p. 290)‏ 
«أرسل أليك كتاياً يثير الرهبة قمت بتالیفه, وبدون كلام فهو علمي» وخال من أي اهتمام 
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إنساني يمكن من خلاله إجراء أبحائك جميعها على الأتساف: ولكن لا تنظر إلى أنه يعذيك أنت 
نفسكء فالآشكال والنحنیات والصيغ قد تقود إلى الجنون أى الحمق». ومع ذلك؛ فإن محاولة 
ثورندايك Obs‏ يضع من الآن فصاعدا تفكيراً (bes‏ للمشكلات القياسية في علم نفس نودي 
بها على صعید واسع. Gaels‏ دراسة نظرية Lillis ala‏ لتدريب العديد من النفسیین 
الشياب. 

ومن قاعات الحاضرات في کولومبیا وهارفارد وستانفورد» اسستقطب الیاحثون من امذال 
شورند ايك وکاتل تخیلات gf‏ تصورات الزملاء الشباب والطلبة الذين یمظون الجیل التالی من 
النفسیین سواء النظرین منهم أو التجریبیین. فقد GS‏ مطوروا الاختبارات عمل بينية 
ویاهتمام بالغ قي انتاج ضخم يلائم الجتمع الأمريكي خلال هذه الفترة من الثورة الصناعية 
وأنتجوا آول مجموعة من اختبارات الذکاء. ففي عام 1917 وبدخول آمریکا الحرب العالية 
الأولى؛ قامت لجنة من علماء اء النفس جيم وفودارد. وهاينزء lari‏ وويل» 
منح هؤلاء راتياً اناسنا 700 دولار من قبل قسم ان وبعدها ‘sci‏ ˆ هؤلاء . مجموعة 
اختيارات غير لفظية للمفحوصین الذين Y‏ يتهدثون الإنجليزية. واستخدمت oda‏ الاختبارات 
في اختيار وتعيين الأقراد الجدد. وفي تحديد المرشحين للتدریب» وفي تسريح الأشخاص غير 
الكفؤين عقلياً )1921 (Yerkes,‏ وعلى الرغم من النجاح في الإستخدامات العسكرية إلا أن 
علماء النفس كرسوا جهودهم لاستخدام اختبارات الذكاء مع المدنيين في الإختيار التريوي 
والمهني. ويجب ملاحظة أن جهودهم أظهرت صراعاً بين مؤيد ومعارض لاستخدام TERS]‏ 
العيارية والتي استمرت أكثر من خمسين عاماً )1975 (Cronbach,‏ . 

وأضاف JS‏ من ٹسرستون وشدف )1929 (Thurstone & Chave,‏ تقنیات لتدریج مقاییس 
الإتجاهات إلى الأدب التنامي في تطوير الإختبارات. وأضاف كل من تیرستون وكيلي 
وهولتزنجر طريقة جديدة في التحليل العاملي. وفي الثلاثينات؛ حدثت تطورات متقدمة بسرعة 
هائلة لتدعم صناعة الإختبارات النامية إذ أن العلماء في هذا المجال أسسوا مجتمعاً نفسياً 
يُسهّل الاتصال بين الباحثين من خلال مجلة أطلق عليها أسم سيكومتريكا 
(Psychometrika)‏ وتبعها في عام (1943) نشر مجلة تطبيقية بدرجة أكبر هي القياس 
التريوي والنفسي (Psychological and Educational Measurement)‏ . ومع نشر fic‏ هذه 
الجلات المتخصصة والعديد من المؤلفات في هذا الميدان؛ فان نظرية القياس يبدو أنها 


أصبحت أحد فروع المعرفة التي تهم Carga all‏ والنفستن. 
دور نظرية القياس في البحث والتقويم 


الضروري اعتبار الابحاث في العلوم التربوية ول(جتماعية علی آنها عملية ستال آو اختبار 
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يتألف من مراحل بصورة Bisa‏ وهذه يمكن تمييزها على آنها: 
2. تحدید التعریفات الاجرائية لكل متغیر في الفرضیة. وذلك بتحدید كيف (Sas‏ ضبطه آو 
قیاسه خلال البحت. 
3 تطوير أو اختیار أداة وطريقة لتکمیم الملاحظات على التغیرات جمیعها. 
A‏ اختبار 43.5 وحساسية الأدوات والطرق المستخدمة. l‏ 
على السؤال الأصلي. 
6 تلخيص البيانات رياصياًء وعندما تكون ملائمة إجراء الإختبارات الإحصائية لتحديد 
أرجحية ما إذا كانت البيانات الملاحظة تعود للصدفة. 
إن قناعات نظرية القياس تتلائم بدرجة عالية مع الخطوات (من 2 إلى 4) في هذه العملية. 
ومن الأساسى ملاحظة أن الخطوة (4) تتطلب تجميع البيانات وتلخيصها إحصائياً من خلال 
Lise‏ استطلاعية, وذلك التأكد من أن الاداة تعمل بفعالية قبل إجراء التجريب أو إجراء دراسة 
تكوين التدريج (الخطوات 6,5). وتعزى النتائج الغامضة والمتعارضة التي 528 الأبحاث في 
العلوم التريوية والإجتماعية إلى الفشل فى التثبت من أداة البحث أثناء تطويرها واختبارها - 
تاد قبل اجراء البحث eee‏ نے اكلا Lesy‏ .رس 
tinua‏ قل احراء الد 5 ار واک و الفته امین De efa ۹ ea ec‏ 
البحشيد tS Sats ear 0 a‏ طسوت "ae‏ 
فف العلوم الطبيعية والحياتية, تختبر طرائق القياس قبل استخدامها في آي تجرية. و 
يحاول الكيميائي الحيوي تحليل أي مركب مجهول في الختبر دون استغراق الوقت الكثير في 
معايرة السيكترومتر للتأكد من أنه يعطى قراءات دقيقة لطول الموجة للعينة المعيارية. بالمقابل؛ 
فإن علماء الاجتماع يحاولون تقييم LAS‏ تأثير برنامج تجريبي على متغير معقد مثل مستوى 
القلق العقلى للمريض أو تطور لغة طفل ما قبل المدرسة باستخدام اختبارات لم aS‏ عملياً. 
الياحث الذي يقفز مباشرة من صياغة سؤال البحث وتحديد المتغيرات إلى جمع البیانات 


إن 


التجريبية يشبه من يذهب بایدر فارغة. فهل يلاحظ الباحثون أنه لا فرق بين العالجات التي لا 
يستطيعون من خلالها معرفة أن المعالجات كانت غير فعّالة أو أن القياسات كانت غير دقيقة 
بحيث أنه لم يتم اكتشاف الأثر الحقيقي للمعالجة. إن التاکید والمناداة بمبدأ بناء الإختبارء 
وتجريب الأداة قبل إجراء التجربة النهائية سيؤدي حتماً إلى تطوير نوعيّ شامل للأبحاث 
التريويّة والنفسيّة. l‏ 
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تنظيم هذا الكتاب: 

إن معرفة نظرية القياس ضرورية لأي باحث أو مقوّم تتطلب تجاربه تطوير اختبار نفسي 
لقياس المتغير الذي يهتم بدراسته. ولهؤلاء الذين يستخدمون الإختبارات الصفية وغيرهم من 
المحللين النفسیین» فإن بعض المعرفة لنظرية القياس ضرورية لهم. إن اختيار أداة مُطورة جيداً 
والتفسيرات المنافسة للدرجات هيٍ مسؤولية مستخدمي الاختبارات جميعهم. فالفهم للنماذج 
النظرية العتمدة في بناء الاختبار تُمكّن المطبق من تحقيق هذه الواجبات الهنية التخصصة. 
وهدف هذا الكتاب هى:تأسيس تطبيقات مناسبة لاستخدام الاختبارات وتطويرها. 


وقد تم تنظيم مادة الكتاب ضمن خمس وحدات مميزة ومرتبطة -معاً- بالوقت تفسبه. 
فالوحدة الأولى تركز على المفاهيم المدخلية للقياس والتدريج والتي يجب أن تكون مالوفة لكل 
من پسخدم اختباراً of‏ یطوّره. والوحدتی الثانية والثالثة تتعلق بالخصائص الهمة لدرجات 
الاختبار (الثبات والصدق). والتي تعد أساسية فیما لو اسثخدمت درجات الاختبار في اتخاذ 
قرارات سواء على مستوی الفرد أو الجموعة. وتم عرض النظرية السيكومترية التي تشکل 
الأساس والطرائق الستخدمة في فحص ثبات الدرجات وصدقه بعمق. ومن الواضی أن 
معرفة کهذه تعد ضرورية GLb‏ الإختبارء وكذلك من الضروري لستخدمي الاختبارات أن 
یکونوا على إطلاع جيد بهذه الوضوعات, لذا یمکنهم التقییم الناقد للاختبارات النشورة, وما 
13 کات Uti Laake‏ هن خاش مه تا وس ول الم مه ال Pal‏ نکر 
لطرائق خاصة للفحوص التجريبية لنوعية الفقرات التي تعد مهمة في تطویر اختبارات جديدة 
آو مراجعة وتحسين الاختبارات التوافرة. والوحدة الخامسة والثخيرة تركز على الأ اة 
والقضایا التي تظهر مرتبطة باستخدام درجات الاختبار وتفسیرها. وقد تم طرح مجموعة من 
التمارین في نهاية کل فصل لتقییم القاری واختبار معرفته للمحتوی الطروح في الفصل. 

وكل وحدة في الکتاب Ueki‏ بحيث تقدمٌ في البداية الاسلوب التقليدي في تناول مشکلات 
تطوير الاختبار» وبعد أن یصبح القاری معتاداً على هذه الأساليب وتطبیقاتها في مواقف 
معيارية. فإن عض الشکلات لا يمكن حلها بسهولة بالأسالیب التقليدية. وبعد تصور هذه 
الشکلات تم عرض تقنیات قياسية إضافية (حديثة في آصولها). وعادة ما یصاحبها مناقشة 
لكيفية ارتباط التقنیات الحدية بافکار ومفاهیم تقليدية بدرجة آکبر. ومن غير الدمش 3 
التطورات الحديثة في نظرية القیاس تعتمد أساساً على نماذج رياضية ولحصائية أكثر تعقيد 

من Seales a aN‏ ولهذا السب فاق معدي وي ا 
الأكثر تعقيداً في كل موضوع» وتم ترتيب الوضوعات المطروحة felis‏ على أسباب بیداغوجية, 
وليس من الضروري أن تؤدي إلى الموافقة أو التفضيل لأي الطرق الموصوفة, ويدلاً من ذلك 
نامل SL‏ يرى القاريء أن هنالك شالف متعددة لحل مشكلات تطوير الإختبار» وتخضع هذه 
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الأساليب لافتراضات ومحددات مختلفة. ولوقف ماء فإن الاختيار الموفق للأسلوب الأمثل 
يتطلب فهم ذلك الموقف. 





التمارين: 
1 بَيّن في أي من الانشطة الآتية استخدم القياس, الاختبار أو كليهما: 





as meester Ik ge coe 








واف الم 
عند delasu‏ صوت ال -buzzer‏ 

ج- Ba‏ عالم نفس اجتماعي التفاعل بين آفراد الجنس الواحد وبين أفراد الجنسين 
المختلفين وذلك بأن يطلب منهم الجلوس في مقعد مزدوج في الباص العام في وقت 
سایق . 

د- وزع معلم الصف الأول الابتدائي الطلبة بناءٌ على عدد الحروف الصحيحة الث کتبو‌ها 

ه- آجری باحث مقابلة تليفونية مع الختبرین وطلب من کل واحد منهم الاجابة عل سلسلة 

و- آجری الباحث dose‏ لعدد الاستجایات نعم وذلك لكل منتج Jiu‏ عنه الستجویون. 


2 افترص توصیف الفقرات على النحو المبين آدناه, وقرر ما إذا كانت الفقرات تقیس 
أقصى آداء أو الأداء المميزء أو الأداء الملاحظ وذلك لكل من: 
بمبحث الفيزياء. 

ب- وضع إشارات على الفقرات من قبل المعلم وذلك بعد ملاحظته لأداء الطلبة في تجارب 
بمختبر الفيزياء تمت تحت إشراف المعلم. 
بأنشطة في درس فيزياء. 

د- تتطلب فقرات الإبداع العلمى من الطلبة قراءة وصف طبيعة الظاهرة وتوليد آکبر عدد 
ممكن من التفسيرات المنطقية لها. 

3 اقترحت طردقة جديدة لمساعدة البالخین في اكتساب الطلاقة في لغة تانية. وأراد alll‏ 
تحديد ما fal‏ كانت الطريقة الجديدة أكثر كفاءة من الطرقة التقليدية في التدريس. 
ولقياس الآداء فى الطلاقة باللغة الثانية» قرر الباحث عرض سلسلة مقالات مكتوية 
باللغة الثانية وطلب agio‏ بعدها الإجابة عن الأسئلة المتعلقة بالمحتوى بأتباع ما يأتى: 
استماع الأفراد إلى المقالات المسجلة فى اللغة الثانية والاجابة عن الأسئلة المتعلقة 


== 1 



































4/ في الواقف الإختبارية التطبيقية الآتية, بين أي سيكولوجبي القرن التاسع عشر كان 
لهم الفضل في هذا الموقف: 

1( اختيار فقرات إستبانة القلق الرياضي باختيار الفقرات التي وافق Yale‏ التخصصون 

بالریاضیات ولیس طلبة الصفوف العلاجية. ۱ 

ب) معلم سیطبق في الحال اختبار قرأ ما يأتي من دلیل الاختبار «الرجاء قرامة التعلیمات 
البينة آعلی الصفحة قرامة صامتة وفي الوقت نفسه إقرأها بتاني. 

ج) استخدام إختبار -الضحصية OY‏ ثبت أن درجات هذا الاختبار وضعت الستخدمین 
بالترتیب نفسه الذي قدمه الشرفین على العمل تقریباً بعد ثلاثة آشهر من العمل. 
الوظيفي. 

5 (قرا الوصف الآتي للدراسة الافتراضیا: «يريد مقوم تربوي مقارنة آثار منهاجي العلوم 
الصف الثامن. تتطلب الطريقة (1) من العلمین استخدام مقرر معین وکتاب عمل 
(Work book)‏ للتلاميذء بینما تتطلب الطريقة (B)‏ من العلمین تطویر خطط خاصة 
الزن حول ساسلة من التجارب للخبرية. وفي بداية السنة اختیر (12) صفاً من 
مدارس المقاطعة بحيث تمت مزاوجتها مع suc‏ سنوات خبرة معلميهم, « اختير منها )6( 
صفوف عشوائياً للطريقة (1) و (6) الأخرى للطريقة (ب). وفي نهاية السنة اقتر 
الباحث (50) فقرة تقيس المباديء العامة وتطبيقاتها اليومية واختبر الطلبة جميعهم 3 
وكانت كل فقرة بأربعة thas‏ أعطيت درجة واحدة لكل إجابة صحيحة, وحسب الباحث 
معامل الارتباط بين درجات نسبة الذكاء للطلبة ودرجاتهم في اختبار العلوم. وحسب 
الباحث أيضاً متوسط عدد الفقرات التي أجابت عنها كل مجموعة إجابة صحيحة 
وقارنها باختبار الدلالة الإحصائية. ٠‏ 

خذ بعين الإعتبار الخطوات الاتية في عملية البحث (صياغة المشكلةء تصميم البحث 


sled‏ تطویر الاداق تحلیل الاستدلال الاحصائی. زاوج بس هذه وأحد الأنشطة الآنية: 


1( أختيرت ستة صفوف عشوائياً للطريقة )1( 
ب) اقترح الياحث )50( فقرة تقيس البادی العلمية. 











د) اختیار (12) صف من مدارس القاطعة. 


cY /6‏ من الفعالیات الموصوفة في التمرین الخامس فرع (أءبءجه د) تعد معرفة نظرية 
القیاس أكثر آهمیة؟. 
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الفصل الثاني 
المفاهيم الاحصائية لنظرية القیاس 


يستخدم الاحصاء في العلوم التريوية والاجتماعية لهدفين أساسیین» هما الوصف 
والاستدلال. فالإحصاء الوصفي يلخص أو يصف توزيع قيم مجموعة الملاحظات. والإحصاء 
الاستدلالي يختبر الفرضيات حول ما إذا كانت عينة معينة من الملاحظات المأخوذة من مجتمع 
له توزيع معين لخصائصه. ودراسة الإحصاء الاستدلالي يعد فرع من العرفة له خصوصية 
ليست هدفاً لهذا الفصل. والهدف الرئيسي لهذا الفصل هو تزويد القارئ بمراجعة للإحصاء 
الوصفي الأساسي الذي يفيد في تفسير درجات الاختبار وتقييم نوعيته. والقاريء الذي له 
خلفية في الاحصاء التطبيقي يمكنه تجاوز هذا الفصل. 


درجات الاختبار على أنها متغيرات وصفية لمجتمع محدود: 

ee‏ أن معلم لديه في الصف ثلاثون طالباً أى محلل نفسي لديه (150) طالباً من ذوي 
صعوبات التعلم الذين أحيلوا للمعالجة لمدة سنة. ومع أن كل من المعلم والمحلل النفسي مهتم 
بخصائص الأفراد جميعهم إلا آنهم يميلون إلى تلخيص بعضاً من خصائص الجموعة 
لاستخدامها في التخطيط لبرنامج أو للتقويم. وإحدى الطرائق الملائمة والفعالة في تلخيص 
المعلومات هي الإحصاء الوصفي. 

وفى دراسة مجتمع ما فإن الخصائص الوصفية للأفراد قد تكون ثابتة أى متغيرة. والقيمة 
الثابتة تكون نفسها لأفراد الجتمع جمیعهم. وفي تلخيص بيانات طلاب صف معينء فالعلم لا 
يزعج نفسه بتسجيل البيانات الثابتة (مثل: كل طالب له رأس واحدء فعدد الرؤوس ثابت وله 
القيمة (1)) والقيمة التغيرة هي خاصية قد تتغير من فرد AT‏ في الجتمع؛ والمتغير قد يكون 
نوعي أو كمي. فلون العين متغير نوعي والوزن متغير كمي ودرجة الاختبار متغير كمي. 
افترض أن معلم أعد اختبار في الأحياء مؤلف من )10 فقرات وتقدم إليه )50( طالب» 
ويحصل المفحوص على نقطة واحدة لكل فقرة يجيب عليها إجابة صحيحة: ولا يُعطى أي 
درجة daze‏ لذا فان درجات الاختبار تتراوح بين (صفر و 10). فإن أخذنا بعين الاعتبار 
الدرجات الملاحظة فقط فإن درجة الاختبار تكون متغير متقطع وذلك GY‏ القيم الممكنة محددة 
بدرجات آو قيم معينة على خط الإعداد الحقيقي. ففي هذه الحالة لا إمكانية للحصول على 
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gOS) taal‏ )1903.95 ذلك كرت أن الف اتف ol‏ قت عدن متمد عن 
aly al‏ ای د نة لكل طالن: alps‏ لد شوه عم ال مات وال 
الاحصائی المترتب على ذلك يكون لوقف يتألف من عدد محدد من الملاحظات لمتغير متقطع. 
واضطلاها فان الق ابحسویه patel‏ اللأنحطات فومؤ ليا بابيكتكدام الخروف ASS‏ 
ونطلق عليها اسم بارامترات أو معالم. وسنعتمد هذا الاصطلاح في تعريف المفاهيم الأساسية 
المهمة الستخدمة في وصف توزيع الدرجات في نظرية القياس. وفقط عند ذكر ملاحظات 
tas‏ فان abla‏ الو )تن عم E‏ تخس UA‏ مظات. 
الجداول التكرارية والنحنیات 

لنعد إلى معلم الأحياء الذي آعد الاختبار المؤلف من (10) فقرات ولخمسین طالباً. فاذا 
آراد العلم تلخيص أداء الجموعة الكلية. فإن إحدى الطرائق الهمة والحساسة هي تحدید 
التوزيع التكراري للمتغیر. ویستخدم التوزیع التكراري لتخصیص القیم التي تظهر للمتفیر 
وکذلك Las‏ ملاحظة هذه القیم. وتدون التوزیعات التكرارية غالباً على شکل جدول أو منحنی 
«aly‏ وانفترض أن x‏ قمثل التخیر (درجة اختبار الأحياء)؛ ویوضع الجدول (1-2) الجدول 
التكراري لدرجات الفحوصین وعددهم )50( على اختبار الاحیاء المؤلف من )10( فقرات. 
وتتراوح الدرجات الممكنة بين (صفر و 10)» ومرتبة تنازلياً في العمود الأول آقصی اليمين: 
ويبين العمود المرمز له ب )£60 عدد الفحوصین الذين حصلوا على کل درجة أو بمعنی آخر 
هو تکرارات کل قيمة (). ویشیر العمود الثالث إلى التکرار التراكمي لكل درجة (X)‏ 


جدول (1-2): الجدول التكراري لدرجات المفحوصين على الاختبار المؤلف من 10 فقرات. 

















== 37 























num يان‎ ween o اميه‎ mammaen لعو سوسس‎ aaae. ل‎ a 





والتكرار التراكمي هو عدد المفحوصين الكلي الذين تكون درجاتهم تساوي القيمة (x)‏ و أقل 
منها. لهذا فان cf)‏ ل × = 3 تكون (5 + 3 + 2 + 0 = 10)؛ أي المجموع الكلي لتكرارات 
الدرجات (0,1,2,3). ويشير العمود الرابع إلى نسبة الطلبة الذين حصلوا على درجة معينة X‏ 
ویرمز لها ب pP)‏ ويطلق عليها اسم «التكرار النسبي». لهذا فإن احتمالية حصول الطالب 
عشوائياً على الدرجة (10) من مجموع الطلبة الكلي یکون )1/50( أو (02.). ویشیر العمود 
الأخير إلى الاحتمال التراكمي لكل درجة (x)‏ وهو النسبة المئوية للذین حصلوا على الدرجة 
(x)‏ آو أي درجة أقل منها. ٌْ 

ویمثل الشكل )1-2( مدرج تكراري لبيانات جدول )1-2( ويُمثل المحور الأققي الدرجات 
(), بينما التكرار النسبي لقيم (X)‏ تمثل على المحود الرأسي. ومن هذا التمثيل نرى أن 
الدرجات (4 , 5 , 6) تظهر بتكرارات أعلى من الدرجات (0, 2 , 9) و )10( وذلك ببساطة 
من ارتفاع الخط البياني عند تلك النقطة. 

إن وصف كيفية توزيع درجات الاختبار Jl)‏ الملاحظات على المتغير) غير مقيد بالجداول 
التكرارية والتمثیل البياني. إذ يمكن استخدام بعض الإحصاءات الوصفية لتغطي بعضاً من 
هذه العلومات. وعلی الأقل فان هناك نوعین من الاحصاءات الوصفية تستخدم في وصف 
توزیع الدرجات هما - مقاييس النزعة الركزية ومقاییس التشنت. 


ور 9 8 7 6 5 4 3 2 1 0 


شکل (1-2): المدرج التكراري لدرجات )50( مقحوص على اختبار مؤلف من (10) فقرات 
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مقاییس النزعة المركزية: 

تمثل مقاييس النزعة المركزية درجة الطالب النموذجية في المجموعةء وتوجد BIE‏ مقاييس 
شائعة الاستخدام في الاختبارات هي المتوسط والوسيط والمنوال. 

المنوال: يعرف المنوال بأنه القيمة الأكثر تكراراً فى مجموعة الملاحظات ولبيانات جدول 
)1-2( منوال التوزيع = 5ء أي الدرجة التي حصل عليها أكثر عدد من الفحوصین. ومن 
الممكن أن يكون للتوزيع التكراري أكثر من منوال. 

الوسيط: هو النقطة التي تتوسط التوزيع لمجموعة البيانات. ونظرياً هو النقطة التي يكون 
أدنى منها وأعلى منها 50% من الدرجات. ویطابق الرتبة المئينية الخمسين. لتوزيع الدرجات. 
ولبيانات جدول (1-2) يقع الوسط بين الدرجتين (4, 5) آو الصيغة الحسابية لتحديد قيمة 
الوسيط بالضبط مبينة في فصل 19). 
المتوسط: هو معدل قيم الدرجات أو البيانات جميعهاء ويرمز له بالرمز «Uh‏ ويحسب من 
الصبغة: i‏ : 
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حيث ترمز Xj‏ إلى درجة الفرد 1ء وتتالف المجموعة من أفراد N passe‏ وإشارة المجموع 
N‏ 


.> عبارة عن رمز جبري شائع الاستخدام يعني مجموع القيم × بدءاً من الدرجة الأولى 
وإنتهاءاً بالدرجة iN‏ حساب المتوسط والاحصائيات الأخرى الوصوفة فى هذا الكتاب 
على القارئء افتراض أن إشارة الجموع تطبق على البياثات كلها عندما يكون الحد الأدنی 
٠ ٠‏ والحد الأعلى للبيانات غير محدد. لذا لمجموعة البيانات: 160 , 155 , 145 , 140 , 150 يكون 


750 = 150 + 140 + 145 + 155 + 160 = Xx 


ويطلق على متوسط التوزيع Gai‏ «القيمة المتوقعة ل ». 


وعندما تکون البیانات منظمة في جدول تكراري مثل جدول )1-2( فإن التوسط الحسابي 
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(0)0 + (1)2 + (2)3 + (3)5 + (4)11 + (5)12 + (6)6 + (7)5 + (8)3 + (9)2 + )10(1 > u 
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وعبر المقاييس BIG‏ الستخدمة في وصف النزعة المركزية فان المتوسط هو المقياس ASH‏ 
شيوعاً واستخداماً للدرجات الاختبارية. وللعديد من الاختبارات العقلية فان المتوسط هو 
الاکثر استقراراً من عينة لأخرئ: وكذاك فان متوسط العينة هو تقدیر غیر متحیز متوسط 
الجتمع. وهذا يعني أن التوسطات الحسوپة من عینات عشوائية لا تکون دون التقدير أو 
lt‏ فيها لتوسط الجتمم الذي أخذت منه العينة. 
مقاييس التشتت 

انرا ما كوخ مقا ال EAE‏ رخن عن CET oo‏ 
ETAT‏ إذا تصورنا آن طالب حصل علی.(5) درجات في اختبار الأحیاء اللف من )10( 
فقرات. ومن أجل تفسير اداژه بالنسبة لبقية الصف فان السؤال الذي يطرحه الطالب أولاً هو: 
ما فیط Mayall‏ وعدا يعرف أن معط SL Aa gual‏ مؤاله SN‏ من 
نوع: ما مدى انتشار الدرجات؟ بلغة آخری: ما مدى التغير في الدرجات؟ فان علم الطالب أن 
معظم الدرجات تتركز بين الدرجتين (6 و 8). وهنا من الأرجح أن يكون عنده بعض القلق بان 
درجته منخفضة نسبیا > أما إذا عرف Gh‏ معظم الدرجات تتوزع بين (9,2) فإنه سيكون 
مرتاحاً Lous‏ لأن العديد من الدرجات أدنى من درجته. ومع ذلك فان درجته الخام ومتوسط 
المجموعة هو نفسه في كلتا الحالتين. إن تفسير الدرجات Sty‏ بالأساس بتشتت درجات 
الاختبار. لذا فبالإضافة إلى مقاييس النزعة المركزية فإن مقاييس التشتت تعد ضرورية 
للوصف المناسب لتوزيع الدرجات. ومقاييس التشتت الأكثر شيوعاً واستخداماً هي المدى 
والتباين والانحراف العياري. 

ویمکن حساب مدی توزيع الدرجات من معرفة آعلی درجة وآدنی درجة في الاختبار» ومثل 
هذا المقياس للتشتت له خصائص عدة غير مرغوب بها . الأول اته يتحدد بالدرجتين التطرفتین 
(والتي غالباً ما تتاثر بالصدفة thay‏ القياس)» وبالتالي فان المدى يكون غير مستقر بدرجة 











كبيرة من عينة لأخرى. والثاني أن المدى لا يعطي مؤشراً عن كيفية توزيع الدرجات بين أدنى 
وأعلى درجة. فمن الممكن لمجموعة منعينة من الدرجات أن تتراوح بين (صفر:و 10): ومن 
المحتمل أن تكون جميعها بين (6 و 10) ما عدا قيمة واحدة. وهنا يكون المدى مضللاً في 
تبیانه لدرجة تشتت درجات الجموعة. 

ویعد كلأ من التباین والانحراف العياري مقاییس تشتت تتغلب على محددات الدی. 
وتعتمد هذه الاحصائیات على مفهوم بسیط للدرچة النحرفة, فلکل مفحوص درجته alll‏ × 
یمکن تحدید الدرجة النحرفة × على آنها: 

BD acerca Nata. ۱ x-u=X 








a ARAS 2 
> x a xm È (x-y)? = D ۱ 
, N x 
والانحراف العياري هو الجذر التربيعي للتباين» أي‎ 
000 0 : 
> x? 5 30 2 0 
N N x 


ولتوضيح حساب كل من التباين والانحراف العياري دعنا نعود إلى مثال الدرجات 
الخمسة )160 , 155 , 145 , 140 , 150). تذکر إن التوسط = 150. لذا فان الدرجات 
النحرفة الناظرة للدرجات الخام هي )10 , 5 , -5 , -10 , 0) على التوالي. وتطبیق العادلة 
)4-2( فإن التباین هو: 


2 
20+ 2)10( + (5-) + (5) +710) و‎ 
5 X 


وبأخذ الجذر التربيعي للتباين نحصل على الانحراف المعياري لتوزيع الدرجات. 


50 = 























1 سب 
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7207 = ۳ = م‎ 
N x 

وعندما تكون الدرجات منظمة في جدول تكراري, فإنه يمكن حساب التباين من الصيغة: 


K 
2 
6-2 Èf x ; 2 
N 


= xo 


حيث ترمز ;× إلى الدرجة المنحرفة (×)» و fi‏ إلى تكرار الدرجة و 6 إلى عدد القيم الممكنة 
ل x‏ ولبیانات جدول (1-2) يحسب التباين على النحو الآتي: 
+ 2)5(1+ 2)4(2+ 3 )6 + 5 )2( + 16( + 12 )%0 +1 203 +5 )-2(2 
3)-3(+ 2)-7(4+ 2)5(0 = 500 
50 





ومع أن حساب الانحراف العياري سهل نسبياً > إلا أن طلبة القياس غير متيقنين من 
معناه. فکیف (Sar‏ تفسير هذا الاحصائي في الواقف التطبیقیة؟ الاول: تذکر أن الانحراف 
الحياري والتباین یعتمدان على الدرجات النحرفة. فکما كانت القیم الطلقة للدرجات النحرفة 
أكبر كلفا كان الانحراف المعياري والتباین أكير. افترض أن مجموعة طلبة مدرسة ثانوية 
أجابوا على مقياس اتجاهات نحو مساويء المخدرات. وعند جدولة الدرجات للمجموعة Í‏ كان 
متوسطها (45) وانحرافها المعياري (10), والمجموعة ب كان متوسطها )45( وأنحرافها 
العياري (17). ویمکننا الاستنتاج من الانحراف العياري الأكبر للمجموعة ب يأن المجموعة ب 
اکثر kabai taas‏ في اتجاهاتهم من المجموعة أ . نحو مساويء الخدرات. 


وصف الأداء الفردي بالدرجات الزائية: 
ن امتوسط والانحراف العياري هما الأكثر استخداماً في وصف خصائص ARY‏ 
ا وإنهنت Las GE‏ في slal‏ تحویلات A‏ والذي یجعل 
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عبد تومز 2 إلى الدرجة الا و ا إلى متوسط الجموعة. و و إلن الانحراف العياري. 
وتشير الدرجة الزائية إلى عدد الانحرافات العيارية التي تقم اعلی أو آدنی من الدرجة X‏ في 
حین آن قيمة الدرجة الزائية تشیر إلى السافة بين الدرجة الضام ومتوسط الجموعة بوحدات 
الانحراف العياري. وتشیر اشارة La all‏ الزاتية إلى ما إا كانت الدرجة اعلی af‏ ادنی من 
التوسط وهذا الاستخدام في ملف الاختبار المبين في جدول (2-2). وبعد فحص الدرجات 
الخام لهذا الطالب فإن الرشد التريوي سیحاول ارشاد الطالب إلى التتخصص في 
الریاضیات آو العلوم آی الانسانیات. وإذا اختبر الفاحص الدرجات الزائية التى تأخذ بعین 
الاعتبار متوسطات وتباینات الاختبارات. ومن الواضح أن هذا الطالب سيجد أن الفنون AST‏ 
توافقاً مع استعداده. وفي تفسیر الدرجات الزائية من الضروري أن نضع في اعتبارنا أن 
متوسط التوزیع = صفر وانحرافه العياري يساوي واحد. 


جدول (2-2): ملف الدرجات الخام والدرجات الزائية التاظرة لمفحوص salg‏ 





أ العلومات الآتية التوافرة لكل اختبار فرعي 


اختبار الریاضیات ۰ 150 فقرة 
اختبار اللغة 0 فقرات 
اختبار العلوم الطبيعية 5 فقرة 
اختبار الانسانیات 0 فقرة 


110 = U 
70 =p 
112 = 4 


90 =U 





26 = 0 


30 = O 


6=0 
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المجتمعات غير المحددة (اللانهائية) والمتغيرات المتصلة: 

أحياناً. نامل في نظرية القياس أن نفكر في توزيع متغير لا نهائي (غير محدود). ففي مثل 
هذه المواقف لا تستخدم العادلة )1-2( لحساب المتوسط ولا المعادلة )5-2( للإنحصراف 
المعيارى. وتوجد صيغة مكافئة للمعادلة (1-2) يمكن تطبيقها بالتساوي للمجتمعات المحدودة 
وغیر الحدودة من البيانات هى: 


=P, x; = u‏ ۱ تزع 


حيث تزمز 26 إلى قيمة × للفرد K‏ و py‏ إلى احتمالية ظهور القيمة ۶. لاحظ أنه عند تطبيق 
هذه الصيغة لمجتمع محدد من البيانات (مثل تلك في جدول 1-2) فإنها ستتجاوز القيمة 
الناتجة عن تطبيق العادلة (1-2). 

بصورة مشابهة, يتحدد الاتحراف العياري لجتمع غير محدود من البيانات بالصيغة: 


© = ترس Dp.‏ | ری اوح 


ومرة آخری عند تطبيق هذه المعادلة على مجموعة محدودة من البيانات أى الدرجات فإننا 
سنحصل على نتائج مشابهة لتلك الناتجة عن المعادلة (5-2). 

ومن المهم ملاحظة أن الإحصاء يشير أحياناً إلى خصائص التوزيع التكراري على أنه 
عزوم» المتوسط كما هو محدد في المعادلة )8-2( يسمى العزم الأول لأصل التوزیع. والانحراف 
المعياري كما هو محدد في المعادلة (9-2) يسمى العزم الثاني حول متوسط التوزيع. 

ومع ذلك فان درجات اختبار fio‏ الاختبارات الصفية واختبارات الذكاء ومقاييس الاتجاه 
تفترض مجموعة من الدرجات أو القيم المتقطعة؛ والسمة المتضمنة في الأداء على الاختبار تعد 
مع ذلك متغير متصل. افترض أن فقرة واحدة تتطلب من المفحوص تهجئة كلمة 
(armament)‏ افترض أن المحوصين (1 ۰ب » ج) لفظوها کف بصورة خاطئة. وحصلوا 
جميعاً على درجة صفر. ومع ذلك فإن القدرة التضمنة في عملية التّهجئة للكلمة قد تکون 
مختلفة عند الثلاثة. فالفحوص ! قد لا يعرف كيف يبدأ تهجئة الكلمةء والفحوص ب قد يكون 
بدا arm...‏ ولكنه غير قادر على تكملة الكلمة بصورة صحيحة: والفحوص ج قد يكون 
تهجاً الكلمة على آنها a-r-m-i-ment‏ ويكون أخطأ بحرف واحد فقط. ومن الواضح أنه يوجد 
تقسيم أكثر دقة لقدرة التهجئة من الذي تعكسه درجة الاختبار. كذلك ويغض النظر عن عدد 
فقرات الاختبار وكيف تم تطوير قواعد التصحيح من الممكن أن نتصور أن الفحوص له قدرة 











أعلى أو أدنى من تلك التي تعكسها الدرجة الملاحظةء فإن كانت الدرجات الملاحظة , 41 , 42) 
)40 وهكذاء فمن الممكن أن نتخیل GG‏ مفحوص ما له الدرجة )40.5( على متصل السمة 
نفسهاء وإذا وسعنا التدريج ليقيس (40.1, 40.2 , 40.3) سيبقى هنالك إمكانية لنتخيل بأن 
هنالك مفحوص له الدرجة )40.15( على متصل السمة نفسه وهكذاء والمتغير المتصل له قيم 
Uses‏ يمكن تحديدها باستمرار بفترات أصغر وأصغر. فيي الحدود العليا والحدود الدنیا 
يفترض للمتغیر المتصل أية قيمة على خط الأعداد الحقيقية. وعندما تقابلنا بیانات متغير 
متصل فان الصيغ المبينة لكل من المتوسط والتباين والانحراف المعياري لا تكون مناسبة. 
فللبيانات المتصلة لا يمكن إجراء عملية الجمع. والصيغ المناسبة لتحديد العزوم (المتوسط 
والانحراف المعياري) لمتغير ذي توزيع متصل يتطلب عمليات حساب تکامل, ولن نعرض هذه 
الحسابات هنا. ومع ذلك فإن على الطالب أن يميز أن Lider‏ من مفاهيم نظرية القياس تعتمد 
على فكرة المتغير المتصل وبالتالي فإنها تتحدد باستخدام الاقترانات والعمليات المستمدة من 
الرياضيات. 


آحد المفاهيم الأساسية لنظرية القیاس هو آلتوزیع الطبيعي» وهو توزيع نظري لتغیر 
متصل مقاس لمجتمع لا نهائي. واهتم الرياضيون بدءا من القرن التاسع عشر أمثال کوتیلت 
وجالتون بإيجاد التوزيعات التكرارية لعدد كيير من الملاحظات (البيانات) على متغير للسمات 
Losie‏ تقاس السمات على تدريج متقطع ولعينة محدودة. ومع أن Lan‏ من بيانات التوزيع قد 
تمثل شكل المنحنى الطبيعي فإن التوزيع الطبيعي للبيانات الحقيقية المستخلصة من عدد 
محدود من القيم المتقطعة لا يمكن أن يكون أكثر من تقريب لهذا النحنی النظري. 

إن النحنی الطبيعي النظري (شكل 12-2) عبارة عن تمثيل بياني لدالة رياضية اشتقها 
الفرنسي كارل جاوس. ويتحدد شكل النحنی الطبيعي بالمعادلة: 


10-2 ۱ e- 0-02 2 =y 
1 
2 
; / 2160 . ا نا‎ 
معينة × » و © تمثل الانحراف المعياري‎ Lad وتمثل لا في هذه المعادلة ارتفاع المنحنى فوق‎ 
لتوزيع درجات ×> وتمثل ۳ المتوسط. والقيم الثابتة في هذه المعادلة هي 7 وتساوي 3.1416 و‎ 
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مختلفة لكل مجموعة من الملاحظات فإن المعادلة (10-2) لا تعرف منحنى واحد بل عائلة من 
المنحنيات التي تشترك في خصائص معينة. 

ومع أن المعادلة )10-2( قد تظهر منفردة فإن ن المثال التطبيقي يفيد في حل بعضاً من 
الغموض في هذه العادلة العقدة. في البداية لاحظ أن 2 (x - (2/٥‏ هي 22 لأي قيمة X‏ 


ولاحظ أن ألكمة ae a‏ هي نفسها لجميع قيم × في التوزيع. ا نريد رسم التوزيع 


1 
الطبيعي الذي متوسطه = 50 وانحرافه المعياري 10 في هذه الحالة فان سیر تساوي 


(04) لقيم × جمیعها في التوزيم. دعنا نفترض ولاهداف التوضیح تجدید قیمة y‏ الدرچة ‏ - 


0. في هذه الحالة فإن الدرجة المنحرفة × = × - ل = صفر. وبالتالي فان 2 = صفر. لهذا 
فان 
Oy‏ 
à )4~‏ ( 2 
(e)004= y‏ 


وتذكر أن أي رقم مرفوع للأس de pire‏ يمكن كتابته على شكل کسر ذي أس موجب. لذا 





فإن: 
و 004 y J‏ = 004 
وحيث ان اي رقم اسه سالب يمكن كتابته على شكل کسر ذو اس موجب. لذا فان 
y‏ =)(0.04 = ( لل ) 005=.04 
ez‏ )2.718( 


وقيم )0.04 و 005.) التي حصلنا عليها من هذه الحلول تعطینا قيمة ارتفاع المدحنى فرق 

القيم x)‏ = 050. و = 30( على التوالي. 
ويجب ملاحظة أن ارتفاع المنحنى الطبيعي عند قيم مختلفة ل × ليست احتمالات» وذلك OF‏ 
× متغير متصل فمن المستحيل تحديد احتمال ظهور days‏ معينة مثل × = SO‏ ومع ذلك فمن 
الممكن تحديد احتمالية الحصول على قيمة لفترة معلومة من الدرجات (مثل: من 49.6 إلى 
505( وفي الرياضيات توجد عملية تسمى التکامل» وهذا التكامل يمكننامن حساب المساحة 
تحت المنحنى بين أي قيمتين. وهذه المساحة تعطينا احتمالية الحصول على درجة من تلك 
الفترة. وعند تطبيق عملية التكامل لدالة المنحنى الطبيعي فإن: 
dx=(42x21)p‏ 2/62( سم 
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حيث ترمز ص إلى الاحتمالية. وترمز 1 ى U‏ إلى حدود الفترة الدنيا والعليا والرموز أ و dx‏ 
إلى عملية التكامل للتعبیر الرياضي الکتوب بینهما. 

وتفسر درجات الاختبار Sule‏ بإيجاد نسبة الحالات التي تقع آدنی sf)‏ آعلی) من درجة 
معینة على افتراض التوزیم الطبيعي. ولایجاد نسبة الحالات التي تقع دون درجة معينة Gb‏ 
نعتبر الحد الادنی للتکامل فى العادلة )11-2( هى( ویکون الحد الأغلى هی الدرجة التی 
دوواد رتك ای العا yl‏ ان هقف یم رازن المسرل على فد 
ما او اقل تیاب ومع دا وس یی SIGE‏ مس الى حل 
RECN Oy tial‏ پا aisha Sid‏ واه WO‏ ای کو ciliate‏ ما 
الاحتمالات دون رژية معادلة النحنی الطبيعي. فعند تحویل درجات التوزيع الملبيعي إلى 
درجات زائية فان توزیع الدرجات الزائية يسمى التوزیع الطبيعي العياري وله متوسط = صفر 
وانحراف معياري = 10. ویبین اللحق () الساحة تحت التحنی إلى سار القیم الزائية 
للمنحنی الطبيعي العياري, فكل فيمة تمثل احتمالية الحصول على قيمة آقل أى تساوي 2 التي 
حسبت من عملية التکامل. كيف یمکن استخدام ملحق )1( قي الحصول على نسبة 
الفحوضین الذین سیحصلون على درجة أقل من قيمة معينة في توزیع یقترب من التوزيع 
الطبیعي؟ ببساطة حول الدرجة الخام إلى برجة زاقية وبعدها استخدم Grade‏ )1( في 
الحصول على الاحتمالية القابلة. مثلاً افترض أن التوسط = 1000ء والانحراف العياري = 
0 ونریسد معرفة نسبة cll pa all‏ هم دون الدرچة 110..الدرجسة الزائيسة القابلة 
) = 1.00( وفي اللحق )1( نجد أن الساحة النسبية تحت المتحثى إلى يسار 
=z‏ 1.00 هو (84.). لهذا فإن )9084( من المفحوصين ستكون درجاتهم تساوي أو أقل من 
Ua, til 0‏ تلم فى clans‏ لان الترسای الوا تعد hast‏ ی وش اه 
الخام. فإن كان توزيع الدرجات الخام الأصلي طبيعي تقريباً فإن الدرجات الزائية تتوزع 
بالطريقة نفسهاء وبالتالي فان النسبة نفسها تقع دون الدرحة الخام الملاحظة والطابقة للدرجة 
الزائية. 

وك الي اا انه Guess he ibaa‏ الذاقة اوه والسالية 
ال لها القيمة اه gpl gadis‏ علن سل الخال اقا كزين يسان اة الع 
غلى درجات 2 تساوي او اقل من القيم (-150 و 1.50]. 

E E ay‏ 2( 5 )2 بصع موق E‏ هه على الط رال و اتات 
المظللة تحت النحنی تشي إلى احتمالية الحصول على درجة زائية تساوي هذه الدرجات أو 


























أقل منها. ومن هذا الشكل يمكن رؤية أن مساحة أقل بكثير تقع دون 2 = -1.5 من تلك التي 
تقع دون 1.50. وإن عدنا الآن إلى اللحق أ وموقع الدرجة الزائية )1.50( في العمود الأول 
فستحصل على الاحتمالية القابلة للدرجة 2 أقل آو تساوي -1.50 من العمود الثاني. 
ونرى أن هذه الاحتمالية تساوي (067.). فلمجموعة مفحوصين بتوزيع طبيعي نتوقع 707 
تكون درجاتهم أقل أى تساوي (-1.50) ومن العمود الثالث یمکننا معرفة أن احتمالية الحصول 
على درجة أقل آو تساوي )1.50( هو 0.933. وعلى هذا نتوقع أن )%93( من الفحوصین 
تقريباً في هذه الجموعة سيحصلون على درجة أقل من هذه النقطة. 
وتشترك التوزيعات الطبيعية جميعها بمجموعة خصائص تعد مهمة في تفسير الدرجات. 
إحدى هذه الخصائص هو أن التوسط وا منوال والوسيط لها القيمة نفسها - وتقع في وسط 
التوزيع. إضافة إلى أن كل توزيع طبيعي متماثل حول نقطة التوسط وذلك أن نصفي المنحنى 
بالضبط كل منهما مرأة للنصف الآخر. فإذا أخذنا نقطتين على المسافة نقسها أعلى وأقل من 
التوسط فإن النسبة نفسها تقع أعلى وأدنى من التومنط ضمن فترة الدرجة نفسها. وأخيراً 
وفي كل توزيع طبيعي وكما هو موضح في الشكل (3-2) فإن )%34( من الدرجات تقع في 
الفترة بين D)‏ = .| +01 ) وحيث أن المنحنى منتظم فإن 434 أخرى من الدرجات 
تقع بين u)‏ = للا +1 ) وعلى هذا فان %68 من الدرجات تقع تقريباً على بعد درجة 
معيارية واحدة أعلى وأدنى من المتوسط. وكما هو موضح في الشكل (3-2) فإن %14 من 
الدرجات تقع تقريباً في الفترة M) a(x 1+ u)‏ +2 به وأخيراً فان %2 من الدرجات 
تقع بين M‏ +02 ولا +03 


(a) Genes! t Fonn u ihe Nonnal Curve 





شكل (2-2): اطنحنی الطيدحي 
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دعنا نرى LES‏ تطبيق هذه العلومات في توزيع الدرجات على اختبار ذكاء معياري (مقنن) 
معروف. وسطه )100( وانحرافه المعياري (15). فإن اختبرت عينة طلبة من مجتمع طبيعي فار 
حوالي 8 من العينة ستکون درجانهم ين )85 و 115) وذلك لان هذه القيم تتاظسر 
( -1 ,)و (yO 1+ UW)‏ کذلك فان(9095) من الجموعة ستکون درجاتها بين )70 و 
130( في GLORY‏ إذ أن هذه القیم تناظر النقاط B)‏ -2 - )و )+2 ) ISI‏ نتوقع 
أن أي درجة آقل من )85( تقع ضمن ال )616( الأدنى من التوزيع» والدرجة الأعلى من 
)130( تقع ضمن أعلى )92.5( من التوزيع. وبالطبع من الممكن تحديد نسبة الحالات التي 
تقع أدنى آو أعلى من أي درجة معلومة في التوزيع الطبيعيء ولكن النسب الناظرة لانحرافات 
معيارية تبعد (1 أو 2 أو 3) عن المتوسط نستشهد بها اصطلاحاً في عرض مؤشرات لتفسير 
الدرجات أو في تحدید درجات قطع للدخول في البرامج المصممة لتخدم عدد محدد من الطلبة 
أو الستركدين (مقل درام الثربية انخاس 


Feregnt of Cases 
under Portions of 
the Normal Curve 





Standard 
Deviations 


شكل )3-2( نسبة الحالات في كل جزء من النحنی الطبيعي 


وصف العلاقة بين متغيرين 

ركزنا حتى الآن على استخدام الاحصاء في وصف توزيع الدرجات على متغير واحد. 
وفی العدید من الواقف یهتم باني الاختیار ومستخدمة بكيفية ارتباط درجات قیاسین مخظفین 
للافراد نفسهم. فما قد یهتم الحلل التفسي تقدص ارتباط Loja‏ الریض النفسي على 
مقیاس الکذپ فی قائمة MMPI‏ مع عدد الجمل الكاذية آثتاء القابلة. وبصورة مشابهة قد 
يهتم مکتب القبول الجامعي بالارتباط بين الاداء على اختبار القبول الدرسي "Scholastic‏ 
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Admission Test”‏ بمتوسط الدرجات فى نهاية الفصل الدراسی الأول. وحتى معلم المدرسة 
قد يهتم بمعرفة مدى ارتباط درجات اختبار الاستيعاب القرائي ومقياس مفهوم الذات 
الأكاديمى. وفی کل موقف من هذه المواقف بطرح مستخدم الاختبار هذا السؤال: ما هي 
درجة العلاقة بين الدرجات على القياسين الأول والثاني؟ 

وعندما pigs‏ بالعلاقة بين متغيرين اثنين» فإننا نريد معرفة ما إذا كانت الدرجة المنخفضة 
على المتغير الأول مرتبطة بالدرجات النخفضة على المتغير الثاني وفيما إذا كانت الدرجة 
العالية على المتغير الأول ترتبط عموماً بالدرجات العالية على المتغير الثاني. لاحظ أننا نهتم 
بالقيم النسبية عندما نتحدث عن الدرجات العالية آو النخفضة. علاوة على ذلك فإننا نهتم 
فيما إذا كانت الفروق عبر الدرجات على التغیر الأول مرتبطة بفوارق مشابهة نسبياً على 
المتغير الثاني. بمعنى آخر علينا أن نسأل كيف برتبط انحراف الدرجات على × (المتغير الأول) 
مع انحراف الدرجات على ۷ (المتغير الثاني). وفي العديد من الحالات فان المتغيرين ( او ) 
يقاسان على تدريجات مختلفة, فمثلاً تقاس درجات اختبار الاستعداد المدرسي (SAT)‏ على 
تدريج مؤلف من )100( درجة على التدريج (×)ء في حين أن متوسط الدرجات (GPA)‏ 
والدرجات المعيارية (المتغير (Y‏ يعبر عنها بأجزاء من الدرجة الواحدة. وللملائمة بينهما يمكن 
تحويل درجات كل من X)‏ و (Y‏ إلى درجات زائية. ويالتالي يصبح كل منهما على تدريج 


التمثيل بالأزواج المرتبة على المستوى البياني: 

|حدی طراثق فهم العلاقة ony‏ متفیرین من التمثیل علی الستوی البياني بحیث آن کل Gab‏ 
من الدرجات (Zy , Zx)‏ تمثل بنقطة واحدة كما هو مبين فى الشکل (4-2). وتمثل درجات ×7 
peal‏ یعرف Ala Yl‏ الصادی. وتتحدد ot Blea)‏ کل نقطة علی النحتی بزوج من cheval‏ 
هما ZX‏ و LY‏ 

OSE ally eta as‏ بدت تا و یرای hei‏ فى اه القن 
السو اكنافيا ).1 CANDELA TY Y sy Cae‏ 
والخط البياني مع العلاقة التي یمظها هذا الخط تمیز من خلال الاتجاه والشکل. 

وقد یکون (تجاه العلاقة موجب gl‏ سالب. ففي العلاقة الوجبة شين الدرجات العالية علی 
التغیر الأول OW‏ تظهر مع الدرجات العالية على التغیر الثاني» وتمیل الدرجات النخقضة على 











المتغير الأول لأن تظهر مع الدرجات المنخفضة على المتغير الثاني. ويظهر الشكل )2 - 15( 
الخلاقة Mea gll‏ بن E AO 4 Za) leaps‏ رجو لاله E‏ متفیرآه عثل 
اختبار الاستعداد الهني (الوظیفی) والاداء الوظيفيء وبين درجات نسبة الذکاء ودرجات 
اختبار الاستعداد القرائي» وبين وزن الطفل الرضیع ومستوی النمو الحس حرکي. وفي 
العلاقة السالية تمیل الدرجات العالية على التغیر الأول لأن تظهر مع الدرجات النخفضة على 
المتغير الثاني, والعکس بالعکس. ویظهر الشکل )2 - کب) العلاقة السلبية. ومثل هذه العلاقة 
یمکن أن توجد مان متفیرات مثل old‏ الطلبة ووسط درجاتهم GPA)‏ آو مثل الدرجات cele‏ 
کل من مقیاس القلق وتقدیر الذات. 
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شكل )4-2( رسم للنقاط المعتمد على الدرجات الزائية لمفحوصين اثنين 

ونود تمييز شكل إنتشار الخط البياني على أنه يمثل بعض الأشكال الهندسية. والشكل 
الأبسط الذي يمكن استخدامه في تمثيل العلاقة بين متغيرين هو الخط المستقيم. وفي وصفنا 
لشكل الانتشار نهتم بمدى دقة الخط المستقيم في تمثيله للنقاط. فالشكل )2 - 5 ج) يوضح 
LADY!‏ عندما تقع النقاط کلها على خط مستقيم قري ومثل هذا الانتشار یشیر إلى علاقة 
تو ون داد 2 و20 :ولاخ الط | لمك يكن رش سیخ ك جنيع النقاط قر 
جداً من الخط المستقيم. ويمكن ملاحظة مثل هذه العلاقة إذا كانت كل من Zx)‏ و 2) تمثل 
درجات على صيغتين متكافئتين لاختبار في الرياضيات متساويين في الطول والصعوية 
ومتناظرین في الحتوی وتم |عدادهمافي الي نفسه. وشکل الانتشار البيضوي في الشکل )2 


چیه مت ar‏ 


هذه العلاقة نين متغیرات مثل الدافعية التحصیل ومتوسط الدرجات مع أن ميل ذوي الدافعية 
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العالية لأن يحصلوا على درجات عالية في الاختبارات للدرسية إلا أن ترتيب الأفراد على 
التغیرین لیست تامة. ١‏ 

وتمثل الأشكال )2 - 35( و )2 - 5ه) حالات یمکن القول أنه لا علاقة خطية بين درجات 
ZX‏ و Zy‏ ففى العلاقة غير الخطية )2 - (a5‏ یمکن تمثیل شکل الانتشار بشکل هندسي غير 
اله القع بصورة افضل. فالعلاقة ين فترة العلاج <2 ومستوی التعدیل النفسي Zy‏ 
يمكن أن تكون علاقة غير خطية. وشكل الإنتشار الدائري في الشكل (2-كه) يشير إلى 
علاقة ضعيفة أو لا علاقة من أي نوع بين درجات (ZY ZK)‏ فلا يوجد نمط تنبؤي بين درجات 
×7 و Zy‏ فكل فرد يحصل على أي ZX Lays‏ يظهر GL‏ يمكن أن یحصل على درجة 
منخفضة أو متوسطة أو عالية بالتساوي على ZY‏ والمثال الأخير (شکل2-کو) يوضح نموذج 
انتشار خطي واضح للبیانات, ولكن لا علاقة بين Zx‏ و 2. فالعلاقة الإحصائية التي تصف 
مدى تغير القيم على 2 المقابلة لتغير القيم على vy‏ فإن كان هناك تغير قليل أو لا تغير في قيم 
المتغير × أى y‏ فان العلاقة تكون ضعيفة أو لا علاقة بين المتغيرين» وحالة كهذه تظهر عندما 
يحصل الجميع على الدرجة نفسها على أحد المتغيرين فعندما يكون الإنتشار عمودي أو أفقي 
تماما فإننا نقول gb‏ لا علاقة بين المتغيرين. 
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(و) خط افقي Y‏ علاقة (a)‏ لا علاقة 
شكل (5-2): التمثیل البياني المعتمد على الدرجات الزائية التي تظهر العلاقات المختلفة بين المتغيرين لاو Y‏ 














إن أشكال إنتشار مثل تلك التي في الشكل )5-2( تدعم فهم العلاقة بين المتغيرين» فمثل 
هذه الرسوم البيانية لا تسمح بوصف دقيق لدرجة العلاقة. فإذا نظر اثنان إلى التمثيل البياني 
نفسه فإنهما يستخلصان إنطباعات مختلفة عن days‏ العلاقة المثلة» وعلاوة على ذلك يمكن 
أن يظهر خطان بيانيّان الشكل نفسه. وبالتالي فان هنالك مواقع مختلفة للنقاط التي من 
الصعب اكتشافها من النظر إليها فقط. ولهذا السبب فمن الضروري أن يكون هنالك معامل 
عددي يصف درجة العلاقة الخطية بين مجموعتي بيانات المجموعة نفسها من الافراد. 


معامل ارتباط بيرسون 

أحد مقاییس العلاقة الخطية بين مجموعتين من الملاحظات احصائی يعرف بإسم «معامل 
الارتباطه. ومع أن هنالك due‏ أنواع لهذا العامل إلا أن المعامل ASV!‏ شيوعاً وامستخداماً هو 
معامل ارتباط قدمه مقاهیمیاً جالتون واشتقه رياضياً فيما بعد بیرسون, فعندما تمثل البيانات 
(yx)‏ بالدرجات الزائية فان صيغة معامل الارتباط هي: 


ttn on 2 اع‎ _ w 


N 
عدد الآفراد. ومن المهم ملاحظة أنه في حساب حاصل ضرب الدرجات‎ N حيث تمثل‎ 
(3-2) يجب أن تحسب لكل فرد قبل إجراء عملية الجمع. ويبين الجدول‎ Zx Zy الزائية فإن‎ 
الدرجات الزائية لاختبار الاستعداد ومتوسط درجات (10) أفراد مع توضيح لخطوات حساب‎ 

ما ال 

وتمتد قیم معامل الارتباط من -1.0 إلى ۰1.0 وتستخدم قيمة الرقم کمقیاس لقوة العلاقة 
الخطية بين المتغيرين: وتشیر الاشارة إلى الاتجاه الوجب أو السالب للعلاقة. وعندما تقترب 
قيمة xy‏ من الصفر, فهذا يعني آنه لا علاقة خطية أو آنها ضعيفة بين التغیرین. وعندما 
تقترب قيمة Pry‏ من 1.00 فانها تشیر إلى علاقة موجبة قوية بين التغیرین فمثلاً تتراوح 
معاملات الارتباط بين اختبارات الذکاء الطبقة فردياً وجمعیاً بين )0.80 إلى 0.90( ومؤشرة 
إلى تشابه کبیر في آداء الأفراد على الاختبارین نسبياً. بالقابل فان معامل الارتباط بين قلق 
الاختبار والاداء فى الاختبارات التحصيلية تتراوح Bale‏ بين (-20. إلى -40.) ومؤشرة إلى 
aie‏ عم dias wile‏ 


= 3ه سس 
































جدول (3-2): حسابات توضيحية لمعامل ارتباط بيرسون بالاعتماد على الدرجات الزائية 
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X-UX د‎ Zx 





YUY = Zy 





فإذا عوضنا هذه الكميات ×2 و ZY‏ فى العادلة )12-2( سنصل إلى الصيغة الآتية والعبر 


es eee ean 2.(x-[4x)(My-[Ly) 
Nox oy 


لاحظ أن الكميات (Mx-[x)‏ و (My-Hy)‏ يمكن كتابتها كدرجات منحرفة, وعلى هذا OB‏ 
التعبير الثالث لمعامل الارتياط هو: : 





= px 
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توت سب بت ليد eee pee em‏ 





0 ب ال‎ + ie Snapped + 1 ويف سم حوري ومنت‎ 5 eas 
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Nox oy — دك‎ 


dilly‏ من الهم ملاحظة آنه یجب حساب حاصل ضرب الدرجات النحرفة ثم جمعها 
للأفراد جميعهم: ومع ذلك فقد تم عرض ثلاثة صيغ لمعامل الارتباط تعطي جميعها القيمة 
العددية نفسها. وسنجد أن صيغ الدرجات الزائية والدرجات المنحرفة مفيدة خاصة في 
الاشتقاقات العديدة المعروضة فى الفصول التالية. ويوضح الجدول (4-2) حساب ال 
الارتباط من الدرجات الخام EENT‏ المعادلة (14-2) (لاحظ آن الدرجات الخام المقابلة 
. للدرجات الزائية على اختبار الاستعداد والمتوسط للدرجات نفسها المبينة في جدول (2-2). 


تفسير معاملات الارتباط 

لا مناقشة لعامل الارتباط يمكن إكمالها دون مناقشة الاعتبارات التى تؤخذ بالاعتبار عند 
تفسيرها. إحدى هذه الاعتبارات هي ما إذا كانت قيمة معامل الارتباط كبير إلى درجة كافية 
ليؤشر إلى علاقة Lage‏ أو ذات معنى بين متغيرين أثنين. على الأقل يوجد محكين شائعي 
الاستخدام في الحكم على أهمية الارتباط الإحصائي: 

E Was بخطف‎ Lia MN هل مخامل‎ 1 

2( ما النسبة المئوية للتباين على × والمشترك مع التباين على و؟ 

لتطبيق الحك الأول على الباحث أن يأخذ بعين الاعتبار إمكانية کون العينة مسحوية من 
مجتمع له pry‏ = 0.00 ولاختبار هذه الإمكانية على الباحث أن يؤسس فترة من القيم التي 
تحتوى على )%95( من معاملات الارتباط الناتجة عن )100( عينة حجمها N‏ أخذت من 
مجتمع له قيمة pry‏ = 0.00. وهذا المدى يكون منتظماً حول الصفرء فإن كان الإرتباط 
الحسوب من العينة الفعلية يقع خارج هذا المدى فان الباحث سيستنتج أن الارتباط الملاحظ 
يختلف عن الصفر وبدلالة (وتذكر أن الباحث يكون واثقاً بنسبة 9695 فقط لاستنتاجه). فإن 
کان الارتباط gual‏ للعينة الفعلية یقع ضمن الدی الشار TE‏ الباحث لن یعدل 
استنتاجه بان الارتباط اللاحظ یختلف ge Wo LGA)‏ الصفر. ولتکوین الفترة الضرورية 
حول و« = صفر على الباحث أن یفترض بان القیم للعینات الافتراضية المئة تتوزع اعتدالياً 
حول pry‏ = صفر. تذکر أنه وفي التوزیم الطبيعي يقع )%95( من الحالات تقريباً على بُعد 
ast‏ ان مار يون القوسط ى من وقد Gland‏ افون Meal‏ اها لريب 
الانحراف العياري لعامل الارتباط حول pry‏ = صفر, وكالاتي: 
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حدول (4-2): حساب توضيحي لمعامل ارتباط بیرسون المعتمد على الدرجات الخام 
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وهناء يكون )%95( من العينات التي حجمها )50( فرد ATENT‏ من مجتمع حيث pry‏ = 
صقر تفع ضمن ا مدى )0.0 Op + 0.0 , 2op-‏ 2( آو دين )-28. إلى 28 وجب ملاحظة أن 
المعادلة )15-2( هي تقريب hall‏ المعياري لمعامل الارتباط والذي يكون دقيقاً فقط لقيم N‏ 
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الكبيرة. وقد اقترح كل من مكنمار )1962 (Mc Nemar,‏ وهیز )1981 (Hays,‏ أن aka‏ 
الصيغة thal‏ المعياري يجب أن تطبق عندما تكون قيمة N‏ تساوي )50( أو أكثر. 

الك SE‏ للم oles‏ الأرقاظ من tad‏ مر MEGAN Glee‏ منم وهته ial‏ تقس 
على أنها نسبة التباين في درجات y‏ المرتبطة بتباين درجات x‏ فان ان pry‏ = 70.« فهذا 
يعني أن %49 من تباين ل مرتبط بالتباين على × ولكن %51 من التباین التبقي في درجات ۷ 
غير مرتبط بالفروق الفردية على المتغير x‏ وطريقة آخری لتفسير هذاء هو المثال الآتي: 
افترض أن عالم نفس نمو حسب الارتباط بين عمر الأم ونسبة ذكاء الطفل 10 عند عمر 3 
سنوات, وكان الارتباط (30.). والانحراف المعياري لدرجات 10 (-15). وتباينها )225( ففي 
هذا الثال 909 من تباين درجات 10 للاطفال مرتبط بعمر pi)‏ وافترض آن الباحث اختار 
مجموعة فرعية من هژلاء الاطفال الذين آعمار آمهم 25 سنة. نتوقع الآن أن تباين درجات 10 
لهذه الجموعة الفرعية تکون اقل من (969) من تباین الجموعة الاصلية إن لا پوجد تغیر مرتبط 
بعمر الأم» وهنا یکون تباين درجات (IQ)‏ مساوياً )204.75( وانحرافها العياري )14.315( 
ویعد هذا اختزال قليل للانحراف العياري لدرجات (10) sie)‏ حدف التغیر الرتبط بعمر 
«(etl‏ وهذا مؤشر إلى أن العلاقة الشار إليها من خلال معامل الارتباط قد تکون ذات فائدة 
تطبیقیة قليلة. لهذا Lids‏ نری الارتباط متوسط القيمة یجب تفسیره بحذر SL‏ انه موش الی 
فسبة مئویة فليلة من التباین الشتراه المتغیر قید الدراسة. 

تحذیران آخران way‏ ملاحظتهما في تفسیر معامل الارتباط الاول, إن اکتشاف علاقة 
قوية بين التغیرین (YX)‏ لا يؤشر وجود علاقة سبب ونتيجة بين التغیرین. فمثلاً راتب العلم 
والشتریات ومعدل الجريمة في الولایات التحدة تبين أن هناك ارتباط موجب بين هذه 
ليرا فهذا لا يعني أن برقع رات الف سيقه‌ي إلى daria‏ مستویات الجرينه Lets‏ 
تفسیر آکثر عقلانية هو ان كلا التغیرین یهکسان عوامل مثل DES‏ الجتمع. وبصورة مشا 
الارتباط العالي بین درجات الرضا الوظيفي وراتب العمال لا یمکن تفسیرها لعنی أن مستوی 
الرضا الوظيفي هو السژول عن رواتب العمال. عوامل آخری متداخلة مثل الاهتمام التنظيمي 
واخلاقیات العمال قد يؤشر على كلا المتغيرين. والتمذیر الآخر الذي يجب أخذه بعين 
الاعتبار في تفسير معامل الارتباط هو أن تقييد (آو خفض) التباين على أحد المتغيرين X)‏ أو 
ال tae emit‏ العامل الارتناظ نیع المعهول عليها معا سر تلم انی 
الطلبة الجدد چمبعهم في جامعة كجيرة haa‏ علی درجات في الاختبان الفرمي في 
ارات روط مع دوحات Eee‏ ا el‏ الفصل الأول وكان ما اد میا 
5 افترض الآن Lil‏ حددنا مجموعة فرعية تحتوي فقط على الطلبة الذين یریژون 
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التخصص في الرياضيات. . من الواضح أن درجات هذه المجموعة على اختبار القبول في 
الرياضيات آکثر baks‏ (أكثر 33 تقييداً) من درجات المفحوصين جميعهم. كذلك فإن الدرجات 
المنحرفة على اختبار الرياضيات A‏ أقل لهذه المجموعة. فإذا حسينا معامل 
الارتياط لهذه الدرجات ذات الانحراق الأقل (مع أن كلا من قيمتي البسط والمقام انخفضتا) 
sas‏ أن BLY!‏ انخفض. 

إن آثر تقييد التباين أكبر في المقام؛ وبالتالي فان معامل الارتباط سينخفضء Sly‏ معامل 
الارتباط الملاحظ لهذه المجموعة الفرعية الملتجانسة سيكون أقل من 0.75. إن تقييد تباين 
الدرجات يمكن أن يظهر إذا صمم الفاحص الاختبار وكان صعب Jie GY eee iam‏ 
هذه الاختيارات ستجعل درجات المفحوصين متشابهة. وعند الحصول على معامل ارتباط 
منخفض ينصح الباحث بالانتباه إلى إمكانية وجود تقييد في التباين Lof‏ بسبب العينة أو 
بعض مظاهر عملية القياس التي تؤدي إلى علاقة غامضة مضللة ممكنة بين بين التغیرات التي 
نهتم بهاء وفي هذه الحالة يفيدنا فحص شكل الانتشار. 


التنيؤ بأداء الفرد 


عندما يتحقق مستخدم الاختبار من وجود علاقة قوية بين درجات اختبار معين وبعض . 


التغیرات الاخری» هنا نرغب باستخدام درجات المفحوصين للتنبؤ بالأداء على متغير آخر. 


ومثل هذه التنبؤات تعتمد على خط الانحدار والذي يعد أفضل خط مستقیم يمثل شکل 
الانتتشار. ويمكن اشتقاق خطوط الانحدار من الإنتشار المعتمد على الدرجات الزائية 
أوالدرجات الخام. 
خط الانحدار 
من معلوماتك الأساسية في الجبر يمكنك تذكر أن معاملة الخط المستقيم تتحدد بالصيغة العامة: 
c = >‏ + ره CS eee ee‏ 


حيث تمثل b‏ ثابت يعرف بميل الخط المستقيم و 6 ثابت يعرف بالقاطع. ويمكن تعريف ميل 
الخط الستقیم بعدد النقاط على الحور العمودي التي ترتفع (آو تنخفض) لكل زيادة بمقدار 
وحدة واحدة على الحور السيني. والقاطع هو النقطة التي يلامس بها خط الاتحدار الحور 
الصادي, وهو Lit‏ كني( عند نقطة us)‏ = صفر). وعندما يعبر عن التغیرات (YX)‏ 
بالدرجات الزائية فإنه يمكن كتابة الصيغة العامة لخط الانحدار على النحو الاتي: 


17-2 m (Zx) = VA ) 
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بهذه الصذورة تعد العادلة )17-2( حالة خاصة للصيغة العامة لعادلة الخط المستقيم عندما 
يساوي القاطع صفر. وعند فحص انتشار الدرجات الزائية في الشكل (5-2) الذي يبين علاقة 
خظية يوهي أن كل تا یمرک كول الف ولهد ا ماخ خط ااتمار QV‏ من atasi‏ 
الدرجات الزائية يجب أن يمر فى نقطة الاصل. فان قيمة القاطع (y)‏ فى معادلة انحدار کهذه 
شاوی متفر با موش الک L162)‏ انان مرمدية من خلول اتشيار نما 
اعتماداً على الدرجات الزائية. 


هذا ويجب على القارئ أن يميز بين الرمزين ZY)‏ ,2 والتي هي قيم حقيقية لدرجات 
الفرد الملاحظة. ويتكون خط الانحدار من متصل لمجمنوعة نقاط وأعلى من أي قيمة لدرجة 
الفرد ZX‏ وقيمة 2 هي الدرجة الزائية على المتغير y‏ المتنبأ بها للفرد عندما يحصل على 
درجة digas Zx‏ لاحظ انه ولأي قيمة ZK‏ من المكن الحصول على القيمة التتبا لها 7 من 
خط الاتمهان,نوفها ضحم حت اقيم 2۳ الذي لا فهر ف taal‏ وملاحظة آخری هن أنه 
ولأي قيمة ×7 توجد فقط قيمة واحدة ل ر2 مع أن انتشار البيانات الفعلية يظهر قيم عدة ل 
ZY‏ لدرجة معينة ZX‏ 

وعندما يطابق خط الانمدار الانتشارء فإنه يوجد على الأغلب تناقض بين القيم التنباً بها 
لبعض الأفراد على المتغير لا والقیم الفعلية لها. ويسمى هذا التناقض بخطأ التنبق وقیفته (Zy‏ 
ZYY)‏ -. ويتبين من الشكل )7-2( ان قيمة 7 المتنبا بها لكارل = 93. ولكن القيمة الفعلية 
تساوي 1.8. فإذا استخدمنا خط الانحدار للتنبق بدرجة كارل فإن خطأ التتبق سيساوي 9490 
من Ze ull‏ الزائية: وإذا اسستخدمنا خط الاد ان بالدرجات الؤاتية لكا على اكير ¥ فان 
خا ال سشتا وی 7 هن all‏ الان فن الراك أن عفن احظاء SAAN‏ ناك عن 
استخدام خط الانحدارء فلماذا نهتم بتطوير خط انحدار واحد لمجموعة معينة من البيانات. 
افترض أن ZX‏ تمثل الدرجة على اختبار القبول في الكلية» و Zy‏ تمثل معدل الدرجات. فإذا 
حصلنا على كلا الدرجتين لعينة واحدة من الطلاب (مثل صف عام 1984(« فمن انتشار هذه 
النقاط يمكن تحديد خط الانحدار الذي يسمح لعمل تنيؤات حول المعدل لمن سيطبق عليه 
الاختبار مستقبلاً بالاعتماد على درجاتهم على اختبار القبول (ZX)‏ وكخلاصة فعندما تتوافر 
بيانات عينة حالية على التغیرین» فإنه يمكن استخدام خط الانحدار التتبؤٌ بأداء الفحوصین 
مستقبلاً والذين تتوافر بياناتهم على أحد المتغيرين فقط. 

وفي أي محاولة لتمثیل الانتشار bas‏ انحدار فانه لا يمكن تلافی الأخطاء نهائياً. 
والحصول على افضل خط gulls‏ البیانات فانه يحب LAS!‏ قیمة 2۱ (میل الخط) والتی تقلل 
هذه الأخطاء. والكمية الختارة لتمثل هذه الأخطاء جمیعها هي ر2 - oD (Zy‏ وتعرف هذه 
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القيمة بأنها محك المربعات الأقل. ومع آننا نحاول إيجاد القيمة التي تخفض أقل الریعات إلى 
أقل قدر بالمحاولة والخطاً ونكون بالوقت نفسه متاکدین بأننا لم نجر الاحتمالات الممكنة 
جميعها. ولحسن الحظ فإنه توجد طريقة رياضية هي إيجاد المشتقة التي تفيد في تحديد 
القيمة الأدنى للمعادلة الرياضية, والتى عند تطبيقها على القدار È (Zy - 2y‏ تبين أن 
الكمية لخ ا دار عة کن 
Zy‏ 273 

N 


= m 


الارتباط, ولهذا يمكننا إعادة كتابة المعادلة )17-2( بتعويض > ل m‏ لذا فإن: 


وووممومموووووووووووءنهدودودة" 


Oxy Zx = Zy 


للد 60 
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Carl's sy ™ 3 


مد چم 


۳ 8س = الود Cathy's‏ 
7 س و زار سا وی 
Cathy (Igy = —.83. ty = — 1.00)‏ 


شكل (7-2): الفجوات دين Zy asd‏ الفعلدة و 7 المثذيا بها لمفحصوصين أثنين. 
AS ale‏ الإنحدار للدرجات الخام: ش 
کذلك صیغة للتنبق بالدرجات الخام “9 من قیم درجات ۲ العروفة. ولبناء العلاقة مين الدرجة 
الزائية والدرجة الخام لعادلة التنبژ دعنا ka‏ 2 علی آنها: 











۱-۸ 
N‏ > 
oy | Zy‏ 
ومن المعادلة )18-2( نعرف أن Oxy Zy =ZY\‏ ۰ ويتعويض هذه القيمة نصل إلى أن: 
yuy | oe.‏ 
Oy 9 Ox‏ 
وبالمعالجة لقيمة y`‏ نحصل على: 


(x= Lx) oy/ox= -Uy‏ وم 
U y +pxy (X - Wx) O y/0 x = y`‏ 
ومع أن هذه المعادلة تظهر معقدة. إلا أنه يمكن إجراء تبسيطين عليهاء في الأول Lies‏ نحدد: 
Oxy Oy/lox=by.x‏ 19-2 
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ویطلق على الثابت × لط معامل الإنحدارء وبالتالي يمكننا اعادة LLS‏ معادلة الدرجة الخام 
علی النحو الاتي: 
Pyx (x - Ux) + Wy = ۱‏ 
ویاجراء عملية الضرب تحصل على: 


byx (x) byx (ux) + uy = 1‏ 202 
والآن» دعنا نحدد ثانية القيمة ‏ على آنها: 

-by. x (Ux) + Uy = © 
ومنها نحصل علی:‎ 

21 -2 pxy Q) te = Y^ 


وهذه مطابقة للمعادلة العامة للخط المستقيم. 
ولنوضح ما سبق الآن بحساب معامل الإنحدار والقاطع لخط الانحدار للتنیق بالمعدل من 


0.06 = (34 (0.89) = byx 


والقاطع: 

3.7- = 2.3 + (100) 06- = © 

وق PEED ENTER‏ معادلة الانحدار هذه حساب الدرجة التنباً بها الا لأي مفحوص 
عند معرفة درجته (K)‏ لذلك للمفحوص ذو درجة ‏ = 1.3 فإن: 


(3.7-) + (6.3) (06) = Y^ 


= 25 
ویبین الشكل )8-2( خط الانحدار لدرجات (yx)‏ الخام للبيانات المدونة في الجدول )4-2( 















($03, 2.5) 
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شکل (8-2): توزیع درجات y‏ املاحظة حول asd‏ مُعطاة ل Z‏ و ZS‏ 


لاحظ أنه عندما نستخدم الدرجات الخام لا يمكن أن تکون قيمة القاطم © (صفراً)ء لذا 
فإن خط الانحدار لا يمر بنقطة الاصل, كذلك فإن ميل خط الانصدار للدرجات الضام 
x)‏ 0/ ر (Pry O‏ من المکن أن یکون آکبر من (1.00). واخيراًء وللتبسیط Sas‏ أن Lad‏ من 


قيم (×,) على الحورین عند نقطة غير الصفر. 


الخطأ المعياري للتقدير: 


عند استخدام معادلة الإنحدار للتنبؤ بدرجات الافراد فمن المناسب أن نهتم بمقدار الخطاً 
لهذا التنبق. ويوضح الشكل )8-2( توزيع قيم (X)‏ الفعلية حول قيم (YY‏ لعدة قيم مختلفة على 
التغیر ×. ومثل هذا التوزيع يطلق عليه أسم التوزيع الشرطيء وذلك لأنه يمثل توزيع قيم (Y)‏ 
لقيمة (x)‏ معينة. وکل من هذه التوزيعات له إنصراف معياري, وعلى افتراض تساوي 
الإنحرافات المعيارية الشرطية فان كل منهما يعرف ب الخطأ المعياري للتقدير. وعند التنبو ب 


(YY)‏ من قيمة معينة ل (×) فان الخطأ المعياري للتقدير يرمز له ب ×۷ © ويحسب ب: 


10 Ox | 1- 0 xy Seer 


ولبيانات جدول (4.2) فان قيمة yx‏ تكون: 


027= [089-1 06 =Oyx 
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Rb‏ ی 0 = 27 فان %68 من القيم التنبا بها ل الا 
التي تساوي 2.5 ستقع ذرجاتهم ضمن الفترة (25 ± 10( اي من (2.23 إلى 2.77( 
وتقرييا La‏ فان 9695 منها ستكون درجاتهم ضمن إنحرافين معياريين يين أي بالفترة من (1.96 إلى 
3.04( ومثل هه التقديرات تساعدنا في رؤية التنیق الشکوك بصحته لدرجات الأفراد ge‏ 
انان مغادلة داز 
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4/ لكل من التوزيعات الثلاث. ما قيم الدرجات الخام المناظرة للدرجات الزائية صفرء وما 
قيم الدرجات الخام الناظرة للدرجات الزائية - 1.00؟ 

5 اعتماداً على إجابتك للسؤال الرابع: هل من المنطق القول أنه لدرجة زائية معينة تكون 
الدرجة الخام المكافئة في المجموعة الثالثة دائماً أقل من الدرجة الخام للمجموعة 
الأولى؟ فسر استدلالك؟ 


6/ افترض أن المفحوصين الأربعة اختيروا كجزء من مجموعة كبيرة يقترب توزيعها من 





























1 افترض أنه تم تطبيق اختبار أدائي على ثلاثة مجموعات من المفحوصين في مواقف 
مختلفة. وتم تدوين التوزيعات التكرارية على النحو المبين أدناه. أجب عن الأسئلة الاتية 
دون إجراء أية حسایات: 


(I‏ بصورة dole‏ أي المجموعات يبدو أن آدائها كان الأفضل في الاختبار. 
ب) أي المجموعات يظهر أنها الأكثر تجانساً فى المجموعات الثلاث. 
ج) gY‏ المجموعات يبدو التوزيع التكراري AST‏ شبهاً بالتوزيع الطبيعي. 


== 65 








بو 


Ai 














التوزیع الطبيعي. والدرجات الزائية ليعض أفراد المجموعة على النحو الآتى: 


دیبیکا -2.15 
شارون 215 

رونالد 1.50 

شيلدون 70 


أ) تقريباًء ما نسبة المفحوصين الذين درجاتهم أقل من درجة ديبيكا؟ 

ب) تقريباًء ما نسبة المفحوصين الذين درجاتهم أعلى من شارون؟ 

ج) تقريباًء ما نسبة اللفحوصين الذين درجاتهم بين رونالد وشارون؟. 

د) أي من درجات للمفحوصين الأربعة تظهر بدرجة أكبر في توزيع المجموعة الكلية؟ 
7/ طلب من طلبة الدراسات العليا تحویل الدرجات الخام للمجموعة الثالثة في التمرين 

الأول إلى درجات زائية تناظرها. واستخدم أحد التلامیذ الصيغة: ۱ 

X-u 27 

O 
ونظر بعدها إلى‎ N التكرار التراكمي لكل درجة وقسمها على‎ GAT في حين استخدم تلميذ‎ 
الطبيعي المعياري. فهل يحصل كلا التلميذين على النتائج‎ -Z الناظرة في جدول‎ Z قيمة‎ 





نفسها؟ ولاذا؟ 
8 - افترض أن المتغير × يتوزع طبيعياً وبمتوسط قدره 0.50 وانحراف معياري 10 فما 
قيمة: 
55 
f(x) dx‏ 


45 


حيث تمثل f(x)‏ معادلة المنحنى الطبيعي. 
ب- آعد صياغة المعادلة في 8- Í‏ كما يتم تطبيقها على توزيع درجات الاختبار (للمساعدة: 
آنظر تمرین 6 >( ۱ 
9/ باستخدام الجدول الآتي والتضمن درجات أريعة اختبارات منفصلة لسبعة مفحوصین ‏ 
حولت درجاتهم جميعاً إلى الدرجات الزائية. 


67 















































OTANI‏ ع 


وضع بالتمثيل البياني العلاقة بين الاستعداد والاستيعاب القرائي 





CALS ‘‏ الاستعداد 


والوعي الاجتماعيء وبين الاستعداد وتقدير الذات. واعتماداً على هذه المنحنيات أي زوج من 
المتغيرات تتوافر فيه أقوى علاقة خطية. وهل هي موجبة أم سالبة؟ 


10/ ما هي معاملات الارتباط بين أزواج المتغيرات الثلاث في التمرين التاسع؟ وما نسبة 
التباين في الاستيعاب القرائي المشترك مع التباين في الاستعداد؟ وما نسبة التباين 
المشترك بين تقدير الذات والاستعداد؟ 

1 بمعرفة الارتباط بين الاستعداد وتقدير الذات المبين في تمرين 10 اقترح استاذ أن 
تن الو الاجتماعى يرفع من درجات اختبار الاستعداد. فهل توافقه الرأي 
ولاذا؟ افترض أن الاستان اقترح تحسين الاستيعاب القرائي EE ea‏ 
الاستعداد. الآن هل توافقه الرأي؟ 

2 ما درجة Lill Z‏ بها في الاستيعاب القرائي لمفحوص درجته على اختبار الاستعداد 
2 = -75.؟ وما درجة Laal! Z‏ بها لهذا الفحوص في تقدير الذات» وان كان متوسط 
الدرجات الخام في اختبار تقدير الذات 20 وانحرافها المعياري ۰7.62 فما الدرجة 
الخام Lash!‏ بها؟ 

3 أجرى باحثان مختلفان دراسات على العلاقة بين دافعية التحصيل وموقع الضبط 
الداخلى. ودوّن أحد الباحثين الارتباط الذي حصل عليه أنه أكبر وبدلالة احصائية وبقيمة 
5 من الصفر عند درجة ثقة 4095. ودون الباحث الآخر ارتباط قيمته 0.35 وقال أنه 
ليس أكبر وبدلالة إحصائية من الصفر وعند درجة ثقة 9695 فكيف يمكن تفسير هذا 
التناقض؟ وهل وجد الباحثون درجة العلاقة الخطية نفسها بين هذين المتغيرين؟ 

4 طبق مقوّم برنامج اختبار قبلي وآخر بعدي على مسترشدين اشتركوا جميعاً في 
البرنامج الإرشادي وحصل على البيانات الآتية: 














لاشتبارالقبلي  ٠‏ الاختيار ادي gl‏ بعدي 

مي 20 36 69-۵ 

الانحراف العياري 5 3 

فا ان ees‏ على ترجه 95 الكت و الق يهنا القیبة التبا tea E‏ علق 

الأختدان cell‏ ةوا عسل نري علق tans‏ 15 فى وهای العيلن فول ك ا 
Ansel‏ التنیا بها نفسها مثل جانیت! وهل لهنین الفحوصین البرجة البعدیة القطية نفسهاه 
وهل يمكنك اعطاء مدی لفرق الدرجات التوقع بين درجتیهما البعدیة؟ 
على درجات تبعد 5 نقاط عن بعضها في الاختبار القبلي, فکم تبعد عن بعضها في 
الدزجات ال بها علی الاختبار البعدی. 

6 ارت آن فرشم اتاو EE Bile dl‏ الصرين الرايع هشن :فنا الق 
التي ستستخدمها لتمثيل الیل والقاطع لهذا الخطة وإذا آردت رسم خط الانحدار 
لمات 2 فا القیم i‏ متخ الق اليل والقاطم: 

7 افترض ان رة أعطى biai PAI‏ مؤلفاً من (15) فقرة وحسب نقطة واحدة 
دراك الأختيار مع درجات الاختبار القصیر السابق )0.56( افترض cl‏ الشرف قور 
Lasd‏ بعد أن يعطي لكل فقرة وزناً يساوي )5( نقاط !ذا فانه ضرب درجة کل مفحوص 
بالعدد 5. 
te PE,‏ مان Batt‏ 

EA AA Sod ها کی‎ ets 
هذه الأضافة على الاين‎ SV ما‎ He 
e N oo د- كيف تؤثر هذه الاضافة ی‎ 


9 





kx =x 

KUx = Ux 
F 

بين أن: 
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= بر[ 
O O,‏ 
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الفصل الثالث 


مقدمة الى التدريج 





عند مراجعتنا لتعریفادا اا سنلاحظ أن إعطاء أرقام لخصائص الأشيا 
يخضع لقوانين معينة. وتعرف عملية تطوير قوانين منظمة ووحدات ذات معنى لقياس كميات 
تلات التجريبية بالتدريج. وقد تم اختراع تدريج لقياس الصفات الفيزيائية في الجتمعات 
البدائية. ومن الضروري تطوير وحدات قياس مناسبة ومقبولة لتكميم الخصائص الملاحظة 
للأشياء في مجالات التجارة والزراعة والبناء. فعلى سبيل المثال استخدم قدماء المصريين 
وهدة الذراع لقياس الطول, والتي حددت على أنها طول الساعد من المرفق إلى قمة الإصبع 
الاوسط ويمكن عد عدد الوحدات المكونة لشىء ما. ويهذا فإنه يتكون التدريج عندما تتحدد 
مجموعة القيم المكنة التي يمكن استخدامها أثناء عملية القیاس, وتأسيس قانون واضح لهذه 
القیم. ویجب أن يتضمن قانون التعیین هذا وحدة القیاس الستخدمة في التدریج. ویظهر 
لاستخدام الزدوج لصطلح (Scale)‏ بمعنى تدریج آو مقیاس في بعض مجالات القياس 
التربري والنفسي. ویطلق هذا الصطلح على آدوات قياس معينة مثل مة أو مقیاس 
القلق | ناض » وتستخدم هذه الأدوات لد 
الفصل الأول اسم اختبارات. وهذا لا يتعارض مع استخدام م رتم المقياس-. 
الذي يظهر في هذا الفصل.. ۱ 



















A > 3 Daa 
WN See A ور‎ 


الأعداد الحقيقية وتداريج القياس ۴ 


بیط تذكر أن الأعداد الحقيقية تتالف من الصفر وال sf‏ الممكنة والاعداد العشرية جميعها ما 
بين سالب وموجب وإلى ما لا نهاية. ويمكن تمثيل نظام الأعداد الحقيقية بيانياً ليمثل خط 
الأعداد الحقيقية» وهو متصل sols‏ يمكن تجزئته إلى أجزاء أصغر وأصغر لا نهائية. وكل 
ولخط الأعداد الحقيقية خصائص مهمة عديدة. سنذكرها على النحى الآتي: 
الأول: يوجد كر تابت للقيد/ ويؤشر الصفر لوقع هذا المركز و تكون مجموعة 
الأرقام لها نقطة صفر ثابتة نقول Ob‏ الجموعة لها خاصية المركز الثابت. ومن المهم ملاحظة 











أن العدد صفر بسك بطريقة مختلفة بعض الشيء عن أي Lard‏ أخرى في نظام الأعداد 
الحقيقية. فعند إضافة الصفر إلى أي عدد AT‏ ينتج العدد الآخر dads‏ وعلى هذا فإن القيمة 
الأصلية لا تتغير بإضافة الصفر لها مع أن قيمتها تتغير بإضافة أي رقم آخر لها. 
الثاني: الوحدة ماس لنظام الأعداد الحقيقية مى ) عنصر التماثل). ويالإنتقال بعيداً 
عن المركز فإن الأعداد التتابعقعلی خط الأعداد الحقيقية تقع على بعد وحدة واحدة من العدد 
الذي يسبقها. وحجم هذه الوحدة cul‏ (ویمکن تصورها على آنها السافة بين صفر وواحد). 
لذا فإن المسافة بين أي عددين متتابعين على خط الأعداد وأي نقطة تكون متساوية. 
الثالث: عند مقارنة أي قيمتين على خط الأعداد الحقيقية فإن إلقيمة المطلقة للعدد الأبعد عن 
الصفر يُعد الأكير لأنه يمثل تراكم sae‏ أكبر من الوحدات من العدد الذي يكون أقرب إلى 
صفر. وغلاوة على ذلك فإن العلاقة بين القيم في نظام الأعداد الحقيقية هي علاقة تعدي. أي 
أنه ولثلاثة قيم مختلفة of)‏ ب» جا)ء آذا کانت 1 > ب» و ب > ج يجب أن نستنتج أن 1 > ج . 
وعندما تکون هذه العلاقة صحيحة لجموعة أعداد نقول أن هذه الجموعة لها خاصية الترتيب. 
وعندما تكون هذه من خصائص نظام الأعداد فإنه من الممكن تحديد العمليات الحسابية 
جميعها (الجمع والطرح والضرب والقسمة) ويمكن اشتقاق قوانين العمليات التجميعية 


اترا اد لها. 


فين نظام داد الحقيقية. ra T‏ على أنه 
بخاضية معينة )1951 (Weitzenhoffer,‏ . وبینیستخدم > ا إلى 
مجموعة الملاحظات الممكنة لخاصية معينة لمجموعة آذ ء. أفترض أن لدينا مجموعة أشياء 
مختلقة في أطوالهاء ويمكننا تكوين قواعد تدريج یمکن استخدامها في الريط بين الأطوال 
الملاحظة في نظام البيانات مع القيم على خط الأعداد الحقيقة. فمثلاً يمكن ترتيب الأشياء من 
الأقصر إلى الأطول والعدد الذى يشير إلى col‏ شىء يعتمد على موقعه, فالشىء ee‏ 
يُعطى الرقم 1ء والذي يليه في القصر يعطي الرقم 2 وهكذا ... ويمكن أن تقارن الأشياء 
بوحدة معياريةء مثل وحدة القدم الموجودة على السطرة وإعطاء اعداد تعتمد على الأطوال 
بوحدة القدم. وعندما يتم تحديد قانون التدريج واعطاء أعداد لكل عنصر من بيانات النظام 
يطلق على هذه الأعداد اسم قيم التدريج. وقد تكون الخصائص الأساسية أو العلاقات التي 
تظهر في نظام الأعداد الحقيقية ذات فائدة وقد لا تكون. 







مستويات تدريج القياس 
sun‏ ستیفنز (1946 (Stevens,‏ أريعة مستويات لتدريج القياس تختلف Lord‏ بینها بمدی 
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احتفاظ قیم التدریج بخصائص خط الأعداد الحقيقية. وهي: الإسمي والرتبي والفئوي أو 
الفاصلي والنسبي أو الطلق. 

التدريج الأسمي وتستخدم الأعداد فيه لتصنیف العناصر في نظام البیانات. ولا يكون لها 
خصائص الترتیب. أو للسافات التسباوية بين الوحدات أو الرکز الخابت. فالاعداد على 
قصمان لاعبي كرة القدم أى على التذاکر sad‏ أمثلة عليها. ویستخدم علماء الاجتماع أحياناً 
التدریج الاسمي في ترمیز الاستجابات في بنود الاستبانة الدیموغرافية. فمثلاً يرمز لبند 
جنس الستجیب الذکر بالعدد صفر وللأنثى بالعدد 1, مع أن لا يوجد تمميز كمي بين 
الجنسين في التطبيق. . وتشير هذه الأعداد إلى اختلافات وصنفية للفثات الممثلة للاستجابات 

تصرم لهذه الاشیام. ومح التدریج ی باس تام us‏ 

اا AICTE pe‏ آو استجابة في بیانات النظام له عدد مختلف عن غیره. 
ويمكن استبدال مجموعة الأعداد بأخرى شريطة الاحتفاظ بالطابقة بين مجموعتي الاعداد. 
ویطلق على هذا اسم التحويل التماثل. 

افترض على سبيل المثال أن الاستجابات على فقرة تتعلق بالذهب الديني أعطت الأعداد 
على النحو الآتي: 1 للبروتستانت و2 للكاثوليك و 3 لليهود و 4 لأي ديانة آخری. يمكن إجراء 
تحویل متماثل واستخدام الاعداد الآتية: 8 للبروقستانت. و6 للكاثوليك و 9 لليهود و1 لأي 
ديانة أخرىء ولا يسمح في عملية التحویل (عطاء الرقم 2 للبروتستانت والكاتوليك إذ أن لكل 
منهم رمز خاص به في قانون التدریج الاصلي. أيضاً یسمح التدریج الاسمي بحرية کبيرة في 
عملية تحویل مجموعة قيم التدریج إلى آخری دون خسارة LI‏ معلوسات عن العلاقة بين 
البيانات الأصليةء وهذا ممكنٌ GY‏ قيم التدریج الاصلي التي تؤشر البيانات (فاقدة ل. : الترتيب 
والمسافة والمركز) تحوي القليل من المعلومات الكمية للبدء بها. 

وعندما يتم ترتيب العناصر في بيانات النظام وفق كمية الخاصية القاسةء وتطلب قانون 
التدريج قيماً من نظام الاعداد الحقيقية التي تؤشر بالترتيب نفسه ينتج التدريج الرتبي, 
الرتبي؛ واحد الأمظة الشائعة التدريج الرتبى في العلوم الطبيعية هو تدريج رموز لصلابة 
العادن والذي یست خدمه علماء Les eet‏ صلابة العادن. وهذا التدريع 
مستخدم منذ عام 1822 ويعطي العدد 1 للکلس و 2 للجیس و 3 للکالسیت وهکذا حتی 10 
للماس. وأعطي كل معدن القيمة العددية اعتماداً على قدرته على خدش سطح أي معدن له رقم 
آقل على تدریج الصلابة. فالعدن الذي يخدش الجبس ولا يخدش الکالسیت مثلاً يُعطى القيمة 
5. وکما هو ملاحظ في sal‏ ادلة الجیولوجیا فان هذا التدریج لا یمثل علاقة رياضية تامة. 
فالقيمة 10 على التدریج تعنی فقط صلابة اکشر من 9 ؛ و 53519 صلابة من 8 ودکذا 
(Pough, 1960.0.31(‏ ومتال آخرء الحکم على ملکات الجمال إذ ترتب الکونتیسات من 1 








او اه tT.‏ 














جام نمی الم نفسه في نظام الأعداد الحقيقية, ولكنه:يفتقر إلى خاصیتی sat‏ 
التساوية بين الوحدات والمركز الثابت. ويمكن تحويل القيم على التدريج اليتبي إلى قيم أخرى 
باستخدام أى قانمن‌شربطة الاحتفاظ بالمعلومات الاساسية عن رتب عناصر البيانات. ويطلق 
e- aa a ODD Po‏ 0 ۳ 
أساسا (1 ,2 , 3, 4, 5) als‏ يمكن استيدالها بالأعداد (3 , 10 , 35 , 47, 201( من جهة 
أخرى فان التحويل إلى (10 , 16 , 12 , 18 , 20) على التوالی للعناصر نفسها لا يجون إذ 
العنصر g‏ ل زم a y‏ 

Yaa el tuie معنى‎ ak الأعداد أذ لها‎ 






Gigs SSS al‏ عند آل 






الفرق ق بارجن عند انها “Priel‏ یچیه النخفضتن يمل کم الخاصيا د تقدير 
الكر سيسات على pe eal‏ لو ا اگوی ates‏ الق تا دات 
الما case‏ الوحداي: وی نقطة الال كال :هذا issih‏ املاس وه ا 
الكلي للخاصية المقاسة. للتوضيح تخيل أريعة من الممسجونين في خلية ولديهم طاولة وورق 
اللعب فقط وطرح سؤال عن أطوال هؤلاء ولكن ليس لديهم مسطرة. ولتحديد من هو الأطول 
يجب أن يقيس كل منهم الاخر ووحدة القياس هي طول ورقة اللعب. GS‏ ليس لديهم عدد 
كافي من الورق لقياس الطول feas‏ من الأرض فقد اختاروا ارتفاع الطاولة كنقطة بداية» وتم 
قياس طول كل منهم يعدد من أطوال أوراق اللعب ينها من ارتفاع الطاولة. وتم التعبير عن 
أطوالهم المقاسة بطول 12 بطاقة, وطول 11 بطاقة. وطول 10.5 بطاقة. وطول 13 بطاقة. لاحظ 
أن طول أي شيء يمكن اختياره كنقطة بداية. وهنا يتوافر وصف الأطوال على تدريج فتوي, 
فهذه القياسات منسوية لمركز مناسب (ومع هذا فإن هؤلاء يعرفون أطوالهم المطلقة). 

ويعد تدريج ميزان الحرارة الفهرنهيتي مثال لمقياس تدريجه فاصلي. فقد يندهش القاريء 
لأن هذا التدريج له نقطة صفرء لكن نقطة الصفر هذه ليست مثل صفر نظام الأعداد الحقيقي. 
وهو أن كمية الطاقة الحرارية المثلة بالصفر الفهرنهيتي لو أضيفت إلى كمية آخری من 
Gaga eat‏ كان الكدية الم اف lis sled tae‏ كنات لحري لا حمق هه E‏ 
على ميزان الحرارة الفهرنهيتي الغياب الكلي للحرارة ويالتالي فإن الصفر هنا لا يسلك مثل 
الصفر في نظام الأعداد الحقيقة. ولآن القيم النسبية للمسافات التي تشر قيمة الملاحظات 
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(القياسات) تتضمن معلومات لها معنی» فإن التحويلات المسموح بها لقيم التدريج الفاصلي 


تکون مقيدة. فان كانت × تمثل قيم على التدريج الأصلي و لا تمثل قيم على التدريج Leal‏ 


فإن التحويل الوحيد الذي يحتفظ بالعلومات المتضمنة في مجموعة القيم الأصلية هو ص = 
لذن تا سیخ ابو اقيم ا .لذ فان الق روز 024 iis‏ تسم 
11 5.9 ومیل هن لس اشوین 50 ag WET‏ ی 
بالبناء الذي تجري دراسته.وإذا حاولنا إجراء تحویل غير خطي مثل ص = س2, فإن القیم 
5, 16 , 4, 9 لا تکون العلاقة بینها هي العلاقة نفسها بين (5, 4, 2 , 3) على التدریج 
الأصلي. 

الممستوى الرابع للقياس هو التدريج النسبي أو الطلق, وهذ! له خصائص الترتيب 
tal clas‏ ين الوتصدات Anal Mey leah ly‏ الطلق والعدين من قان 
تاه الق اه حي قان ا i)‏ الول مرسمه سس واا تلاو وال 
بالأيام والشهور والسنین). وأطلق على التدریج اسم النسبي لأن موقع الصفر الطلق معروف. 
ري الور عن افیا سا elk‏ یه على ها التدريع عتسية alee‏ ال ees‏ نهذ 
الأمثلة الشهورة على هذا التدریج هو ميزان حرارة کلفن. إذ تتحدد نقطة الصفر في عند 
الإنعدام الكلي للحرارة. والتحویل الوحید على التدريج النسبي ويحفظ العلومات من التبدیل 
هو ص = ج س dre‏ ج مقدار ثابت. ویجب ملاحظة أن أي مجموعة من القیم تحقق 
ae‏ التدريج النسبي يمكن اعتبارها تحقق متطلبات التدریج الفاصلي (وذلك إذا آردنا 

ن العلومات المتعلقة بموقع الصفر المطلق). وبصورة مشابهة فإن البيانات المجتمعة على 

9 أرقي والبیانات الجمعة علی تدریجات رتبية او فاصلة او نسبية فإنها بالناکید 
تحقق متطلبات التدریج الأسمي. 

jell ایس‎ E مهات ت بدو لفاس کات شنيف‎ Seeing 
(Torgerson, 1958, الوحيدة لتصنیف أو وصف الستویات. فعلی سبیل المثال تحدث تورغرسن‎ 
نوع من التدریج یقع بين‎ (Coombs, 1950b) عن مستويين للتدريج الرتبي» وقدم كوميس‎ 2.19( 
الرتبي والفاصلي. وتطرح دائماً قضية للمناقشة حول القياس في الاختبارات النفسية عما إذا‎ 
كان من المستوى الرتبي آو الفاصلي. وسنناقش هذه القضية لاحقاً في هذا الفصل ببعض‎ 
التتصيل. واولاً فمن الضروري قهم عملیات الشدريع التي تطبق على البیانات النفسية بشکل‎ 
آوسع.‎ 
أساليب التدریج في تطویر القیاس:‎ 

عند تطویر آداة التقییم التربوي أو النفسي فان مطور الاختبار يعمل على اختبار سلسلة 
من اللزضنیات حول تدریج البیانات التي حصل علیها من قپانسه لبناء القترح. 








الاول: يجب صياغة الفرضية ب ‘ هی أن lll‏ له خاصية تظهر بكميات aba‏ لذا 
فانه يمكن تكميمها باستخدام قانون التدريج المقترح على متصل ند ي آحادي الاتجاه. bales‏ 
يالك یه سم بل كنس 


الات السوال عو هة خصاتص الأعداد المقيقية (الترتیب: السافاء (GS pM‏ لقیم 
لتدریج علی canal‏ ومیز تورغرسون USE)‏ 205277 طرائق را يكن الات أن 
Ga‏ كن هذه الفهنایا: طرالق كمرك وز gle‏ الافراد: وطرالق تركو علی الي 
وطرائق تتمرکز على الاستجابة. 
طرائق تتمرکز حول الفرد: 
sags‏ هدا هدف اكش قیاسات الاستعداد والتحصیل, وهو الهدف الأساسي في بناء العدید من 
الادوآت في الجال الاتفعالي. فمثلاً افترض أن محلل نفسي طور متناس cola‏ سکن لهذا 
المحلل أن يكتب 20 فقرة وتصنف الاستجابات على آنها تؤشر على مشاعر الاحباط أولاً. 
وبعد ذلك يؤشر الستجیب وتعطی له الدرجة 1 للإستجابة التي تؤشر للإحباط والدرجة صقر 
للاستچاية القى لا تزشمر» وتحسب درجة كل فرد من جمع درطات الفقرات جمیمها. فالافراد 
الذين لهم درجات عالية يتحدد موقعهم آقرب إلى النهاية للوجنة للمتصل آکثر ما هو للافراد 
Gail‏ رخافم اف dae tay‏ وزن درجات الفقرات يقر از متاسب من مطور الاختبار؛ وی 
الأغلب تعطی الفقرات آوزان متساوية. وقد يعطي القلیل من الانتباه للفروق الحتملة بين 
الققرات التي سيجيب علیها الفرد وذلك GY‏ الهدف الأساسي هو تدریج الافراد. وختی غندما 
يسمح للافراد الإجابة ge‏ کل فقرة.مع.بعض التدرج في مستوی الاستجابة (مثل صيغة 
لیکرت نلاستجابات if‏ یختار الفحوص استجابة تتراوح بین موافق بشدة إلى غیر موافق 
بشدة). gag‏ هذا ینکن أن ینثل طرق تتمزکو: 3:32 #فوناد. وكما لاحظ تورغرسون )1958( 
أن لهذه الطريقة فوائد تطبيقية عدة إلا آنها لا تؤدي إلى تطوير نماذج تدريج تسمح للباحث 
Oy‏ سای یی مرها رش سس ترجه الكلية ونام على افش رام مسا 
وهو أن القیم التي تشر لكل صيغة استجابة ممكنة تشکل تدریج عددي له خصائص رتيبة أو 
رتيبة بوحدات متساوية. 

ویبدو أن اختيار طريقة نفسية تتمركز حول الفرد تسمح للباحث بان يحصل عليها 
شرا اه a S‏ رمعم لاف لحار لسادات اش قله 
وسیواجه الباحث بهذا السوّال Lath‏ فالدرجات ا لاخر ةة من القاییس النفسية یجب اختبارها 
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في الحال التحقق من ثباتها وضدقها (ويوضع الفصل الرابع نظرة عامة لعملية تطوير 
الاختبار والتحقق من صدق وثبات المقاييس التي تتمركز حول الفرد. وتطرح الوحدات الثانية 
والثالثة هذه الطرائق (Least‏ وعندما لا تكون الدرجات الستخلصة بهذه الطريقة من التدريج 
ليست رتبيّة تماما ولها وحدات قياس متساوية تقريباً فإنها لا تحقق معايير صدق وثبات 
مقيولة. وعند هذه النقطة فان مطور الاختبار لا يعرف سيب فشل الاداة حول ما إذا كان 
بسبب قصور خصائص الأعداد في التدريج أو عدم ملائمة الصدق والثبات في القیاس 
للأهداف التي خضعت للاختبار. 


طرائق تتركز حول المثير 

هنا يهتم الباحث في تحديد موقع المثيرات آو (الفقرات) على المتصل النفسي. وكانت 
التطبيقات المبكرة لهذه الطرائق في المختبرات التجريبية لعلماء الإدراك الألمان في عام 
(1800). وأطلق على هؤلاء الباحثين اسم السيكوفيزيائيين GY‏ اهتماماهم كانت في تطوير 
علاقات كمية بين الاستجابة على المثيرات الفيزيائية والثیرات نفسها. ومن هؤلاء 
الاين ارنست ويدن وغوستاف فخنز الذین ترکز اهتسامهم في تحدید الفروق 
الصغيرة في الثیرات الفيزيائية (الضوء, نغمة الصوت. الوزن....الخ) والتي یمکن اکتشافها 
بثبات بالحواس البشرية. فعلی سبیل الثال لقیاس |دراك الضو». فمن الالوف تقدیم إضائتين 
وسؤال الأفراد آیهما AST‏ إضاءة. ومع أن الجرب یمکنه تحدید ذلك بقیاس فيزيائي للمثير 
الأقوى, الا أن الشكلة تکمن في تطویر طريقة لتدریج استجابات الأفراد. وهو: كيف یمکن 
تدريج متصل نفسي لشدة الإضاءةامع أنه تم تطوير طرائق عدة, فإن احداهما وهي الأفضل 


stig,‏ بمقارنة اضاءتین مرات عديدة من قبل الفرد نفسه أو بوساطة مجموعة آفراد. ویمکن 


اعتبار للثیرین متكافئين على تدریج الحواس وذلك عندما يتم اختیار کل مثير بالتکرار نفسه 
)%50 من للرات)» وعندما يتم اختیار مثیر معين لأكثر من %75 من الرات فان الفرق بين 
هذين الثبرین على القیاس نفسه یطلق عليه «الفرق اللاحظ (Just Noticeable difference‏ 
(IND)‏ واختير محك %75 لأنه يقع في منتصف المسافة بين الصدفة والدقة التامة. لقد تم 
استخدام «الفرق الملاحظ» (IND)‏ على أنه وحدة قياس من قبل علماء النفس الأوائل على 
المتصل النفسهيروباستخدام طريقة التدريج العامة هذه ومع تنقيحات عديدة لها قدم ويبر 
القانون الخاص به (قانون ويبر) وحاول اثباته تجريبياًء وهذا القانون ينص على أن الزيادات 
المتساوية في قوة المثير ينتج عنها نسب زيادات مساوية لها في القيمة في الاستجابة الحسية 
للفرد. واقترح فخنر بعدها تعديل باقتراحه لعلاقة لوغاريتمية بين زيادة الاحساس والزيادة 
في المثير الفيزيائي. ومع أن السيكوفيزيائيين بذلوا الكثير من الجهد في دراسة تقنيات 














ays‏ مه lle Chey Saal‏ و وار ما شترا التنوال د كان هه 
الیک دات تفای alee‏ على RAN as, peak E‏ جور رسن C1958)‏ وود 
«الفرق الملاحظ ذات وحدات متساوية نفسياً من خلال التعريف ير 

ویقیت محاولات تدریج القاییس النفسیة محصورة ضمن علماه النفس الادراگي جفی 
الور موه oll ea E yeas‏ رن کاس هقاس AALS‏ و و 
او اف ل all Galas ail‏ ا OLS‏ رشان E‏ :افطل بسا 
الثال: فقد ens‏ آنه یمکن تدریج الجدية في الجرائم وذلك يبتؤال القضاة (الخبراء) آن Lads‏ 
أزواج الجرائم الممكنة في القائمة Yaron‏ (مثل حرق الباني والتهریب. حرق الباني والقتل 
العمد....الخ) وتحدید أي الجرائم أكثر جدية في مقارنة کل زوج منها (Thurstone,1927)‏ 
دراسة آخری لثیرستون كانت عرض مجموعة من الفقرات النظمة التعلقة بالذهب الديني 
تشن E‏ اموي Gas‏ سمل E Weed‏ مسا روا uch‏ شل قو 
[نفعالاته (مشاعره) تجاه الكنيسة:؛ والعبر عنها في (Thurstone& Schave, 1929) ol yall‏ 
وقد جذب عملية تطبيق التدريج على الثيرات اللفظية اهتمام كل من عماء الاجتماع والتربية 
وف تفن ای میک Wie ee E‏ كا E E‏ 
اله من هدح الطرافق این نع نوم القدرهم cles ll‏ و eas‏ هزه Gal all‏ تفه 
E EE‏ فی I‏ القار ناا وظريقة خی تسس اتيم تین 
الأحكام». وتعد قوانين ثیرستون بالفعل أنظمة تستخدم قوانين في تقدير قيم التدريج لكل 
مثیر. وخصص توزغرسون )1958( عدة فصول USI‏ ظريقة من طرائق الشدریج التمركزة حول 
الثیرات by‏ تحتویه من طرق جمع بیانات ومعادلات تستخدم في تقدیر قیم التدریج 
Clee SEN,‏ لحسن الطائقة بن شیم الكذريم E‏ والقدرة::وستل هذه 
clas cased‏ فا تخل وب ذلك نطف انار کف سکن نطق 
قانون الأحكام القارنة عندما تکون البیانات الجمعة هي احكام تستخدم مقارنات الازواج 
الحا سا ی BEN‏ 

اپ قوم يفاض Sh‏ م E AIR‏ ر ا Pee‏ 
نظري يوت في تقدیر السافة بین فقرتي اتجاه نحو استعمال الاسلحة النوویة. والفقرة الاولی 
(1) قد تکون مصاغة على النحو الآتي؛ 

«يجب استخدام السلاح النووي Jas‏ أخير في الحرب؛ 


یفترض ثیرستون أن الأفراد الختلفین لهم آراء متباينة تتعلق بقوة هذه الفقرة. وتتوزع هذه 
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دهعتم یمیت نید دعم حيسي م سیم جا 














الآراء طبیعیاً وذ تتمركز حول نقطة على متصل الاتجاه يرمز لها بالرمز (Wi)‏ (وهذا التوزیم لا 
يمكن ملاحظته مباشرة). والآن لنفترض أن الفقرة (ل) هي 

دلا يجب استخدام السلاح تیش قت ال مروف زر 

. يفترض Las‏ أن آراء الأفراد حول قوة هذه EE E T EE ere‏ 
النقطة (uy)‏ إن موقع كل من ! و بدا تعد ممثلة للموقع الحقيقي لكلا الجملتين على متصل 
الإتجاهات. أخيراً لاحظ أنه ولكل فرد يمكن التعبير عن المسافة بين موقع الفقرتين 1 و 
ز ب (ji)‏ وهذه السافات تتباين أيضاً بتوزيع طبيعيء ويطلق على هذا التوزيع اسم توزيع 
الفروقات المميزة. ومتوسط هذا التوزيع هو: 

uj-ui=ud 

والانحراف المعياري لهذا التوزيع هو زز 0. ويخدم هذا الانحراف العياري كوحدة قياس 


فى تحديد المسافة بين ¡ و j‏ على متصل الاتجاهات من خلال التعبير: 


Wj ui 
6 


1- 


= Zij 


وهذا التعبير هى في الحقيقة الدرجة الزائية والتي تعبر عن الفرق المعياري بين Mi‏ و Hj‏ 
وهو أيضاً السافة العيارية بين الثیرات 1 و j‏ على التصل النفسي. ۱ 
ویکون هدف الباحث في تدریج فقرات مقیاس الاتجاهات أكثر من مجرد زوج واحد من 
الفقرات. وعلی هذا فان السافات العيارية تحسب لجمیم آزواج ol Ball‏ فمثلاً لمثيرات ثلاثة 
P Poe‏ 
1 ۳2 
ع =o‏ 
| ول ولا 
O13 13‏ 
H3 -u2‏ 
7 ال ت 
O23‏ 
وأشرنا مسيقاً إلى أن التدريج الفاصلي له نقطة أصل مناسية. ولحساب قيم التدريج في 














= صفر, لذا فإن قيمة الفقرة 1 على التدريج = صفر (ولا يمكن اعتبار هذا التدريج بشدة 
تدريج نسبي). والآن يمكننا القول بأن: 
و2 < صقر - ۾ ۲۸ 
62 
=Z,‏ صفر - 3 ] 
و0 


وإعانة تركي هذه AG‏ تسل عل : 
O12 )- Z12) = 2‏ 

O13 )- Z13)= و‎ 

2 ول = (و2-) O23‏ 


وإذا عرفنا قيم 712 » و 213 “3 12 «<O‏ 3 013 فإنه من الممكن حل المعادلتين الأولى 
2 2713 5 وليس O72‏ و ور . وقد تم حل هذه المشكلة باستخدام إحدى صيخ قانون 


العياري بالرمز K‏ تصبح معادلاتنا: 
W‏ ار 
PaT a‏ 
tig oe‏ 
ید - ورد - 


ومن الضروري تبين أن هذا ممكناً لأننا افترصنا أن 1۷ = صفرء وپالتالي فإننا على 
الاکثر نحصل على ترتيب فئوي. ونحن نعرف أن التدريج إذا كان فئوياً فمن الممكن تحويل كل 
قيمة على التدريج إلى آخری وفقاً للصيغة .b +)( a‏ وبالتعويض صفر لقيمة (b)‏ و »ر1 
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لقيمة a‏ یمکننا تحديد مجموعة قيم للتدريج الجديد رلا ترتبط يمة بقيم Mi‏ الأصلية 
بالعادلة 0۳ (u) l=‏ + صفر. 

= صفر 

- 212 > Wy, 

وبلا = ور - 

وتعد قيم Mi‏ الحولة لكل فقرة مؤشراً لوقعها على التصل بالنسبة للفقرة التي اعتبرت 
نقطة أصل مناسبة. وفى مثالنا هذا تبقى مشكلة واحدة هي حساب قيم 212 و 213 وذلك 
للحصول على قيم يدا و ّإ على التوالي. 

وعلى القاريء ملاحظة أن كل ما نعرفه عن طبيعة التدريج والعبر عنه بقيم My‏ ليس تدريج 
من اللاحظات التجريبية, واختبار ما إذا كانت هذه الحسابات تتبع التدريج الفئوي. فعند 
أيهما أقوىء فإننا نتوقع أن يشير نمط الإستجابات إلى بعض التشويش في تقدير الأحكام. 
خصوصا أننا نتوقع gi‏ 050 من الأحكام تختار الإستجاية 3j < i‏ 50 تختار الاستجاية 
تختار j<i‏ وفقط 5. منها joi Laas‏ ويزيادة المسافة Asi‏ تجد أن توزيع الأحكام 
ن>ز و Pji‏ تمثل نسبة الأحكام التي تختار >i‏ وبالتالي فإن هنالك علاقة بين احتمالية اختيار 
الحكم j<i‏ عشوائياً (Pi)‏ والمسافة (M J-M i)‏ ويتطبيق قانون ثيرستون للأحكام القارنة ab‏ 
یفترض أن يكون توزیم الاستجابات عبر الأحکام في هذا الوقق خائ الاختیار محکوماً 
بالتوزیع الطبيعي للفروق الميزة. وهذا يعني أن قيم Pij‏ یمکن أن ترتبط بالدرجات الزائية 
باستخدام جدول الاحتمالية العياري الاعتدالی... لذا على سبیل الثال نظرياًء عندما تکون: 

Py‏ = 50 فإن Zj‏ = 000 ش 

0.68 = Zj فان‎ 75 = Pijs 

Zj ob 95 = Pi,‏ 4 ... وهكذا. 

وعندما يكون لدينا فقرتان فقط فإننا لا نذهب إلى أبعد من هذا وغالباً يكون لدينا في 
القاییس أكثر من فقرتان؛ وهنا نسال المحكمين المقارنة ہین الأزواج الممكنة = lyases‏ وإجراء 
JS‏ تحکیم باستقلالية عن الآخر. وبهذا یکون لدینا مجموعة أولية لتقدیرات Zij‏ لكل زوج من 
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الفقرات. Geus‏ نری الآن كيف يمكننا استخدام هذه البيانات فى حساب قيم بلا لكل فقرة. 
واختبار ما إذا كانت هذه القیم تتطبق على تدریج فاصلي. ۰ 
1. افترض أن الشکل )1-3( يبين الواقع الحقيقية لأربع فقرات على متصل نفسي, 
وافترض أنه تدریج فاصلي. وبافتراض أن قیم Oij‏ جمیعها متساوية. فإن قیم Zij‏ 
تساوي السافات بين أي مثیرین Gi)‏ وبالتالي فان ما يأتي یکون صحيحاً: 


234 + Z23 +712 = 4 


Z14 





شكل (1-3): 
العلاقة الجمعية لقيم Zij‏ حيث أن قيم ازواج ‏ للفقرات جميعها تم تدريجها على متصل فئوي 


المثيرات المختلفة تكون مستقلة.ونادراً ما تتطابق قيم Zij‏ الأولية التي نحصل عليها من 

مقارنات الأحكام للأزواج المحتملة كلها وذلك بسبب الأخطاء العشوائية لعملية التحكيم. 
والافتراض هُو أن التقديرات النقحة تمثل إلى درجة أقرب الصورة الحقيقة لوأقم 
الفقرات النسبيء والذي يظهر في حالة التخلص من الأخطاء العشوائية لعملية التحكيم 

۰ (ويوجد لهذا القانون صيغ عدة تعتمد غلى الافتراضات المتعلقة بتوزيعات الأحكام). 

الإحصائية لحسن الطابقة. فإن كانت الفروق قليلة فإن المتصل النفسی يستخدم 
إذا كانت الفروق كبيرة fas‏ (وذلك بمحك حسن الطابقة الإحصائي) فيجب أن نتساءل 
حول افتراض قوة التدريج على أنه فئوي للمتصل المستخدم في تدريج قيم {Sa Zij‏ 
لاحظ تورغرستون )1958( فان الهدف من الاختبار الاحصائی هو تحديد ما إذا كان 
التدريج الناتج تام أو أنه بالتقريب يصل إلى درجة يمكن معها معالجة البيانات على 
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متصل الأعداد الفئوي دون الإبتعاد عن ذلك كثيراً. 
ویمکن استخدام المجمو عة الأخيرة من الفقرات الدرجة الآن بهدف القیاس. وغالباً فان 
الفقرات تقدم لجموعة مستجیبین بصيغة موافق- غير موافق» وتحسب درجات کل مستجیب 
على آنها متوسط درجات الفقرات التي آجاب عنها. ويجب ملاحظة أنه تم اختیار قانون 
الأحكام القارنة هنا GY‏ یزودنا بتوضیح بسيط لكيفية اختبار مقارنة البيانات التجريبية 
ا تدريج متمركز حول امثير دفي تاريخ تطویر تدريج مقاییس | الاتجاهات فقد = محل 





في تقدير الأحكام لأزواج الفقرات المحتملة كلها . ولکنها علب حار تا مق أن 
طرائق تتمركز حول الاستجابة 
وهي الطريقة الأصعب في التدريج إذ مت تستخدم بيانات الاستجابة في تدريج الأفراد 

الذين يجييؤن على هذه الفقرات. 

وسنقدم توضيحين لهذه الفئة من طرائق التدريج. فقد وصف جوتمان ,19419 (Guttman,‏ 
الطريقة عدد قليل غير متحیز من الفقرات. وقد تم ترتيب هذه الفقرات حسب الزيادة في 
القوة. لذلك فإن وافق مستجيب على إحدى الفقرات فيجب عليه أن يوافق على الفقرات 
الأخرى جميعها التي تعبر عن إتجاه (أو شعور) إيجابي أضعف نحو البناء وآن لا يوافق على 

i‏ يحق لرجل الدين فى الخدمة العامة أن يضرب. 

ج- يحق للمرضات في مستشفيات الولاية والمدنية أن تضرب. 


د- Gas‏ لرجل الإطفاء أن يضرب. 


kidas يدين‎ ٠ السموح بها‎ mba N gale a ع ی التسقة‎ A 


ae‏ الأفراد الذين تتطايق Eb‏ اکر كنا کان Stal‏ أكثر على أن هذه lal‏ تکون 

















عدد الاخطاء الكلي 


لمات تت 
sse‏ الاستجابة الكلى 


ويستخدم القيمة 0.90 كمحك لإثبات التدريج الرتبي للفقرات .م ,1958 (Torgerson,‏ 
(323. وطرق تقدير المسافة بين الفقرات على هذا التصل تكون أكثر تعقيداً ولن نيحثها فى 
هذا الفصلء وسنبحث في الفصل 15 النماذج اللوغاريتمية لتدريج الاستجابات على الفقرات, 
وللتدرب على تطبيق المفاهيم الأساسية لتدريج جوتمان فإنها طرحت في تمارين نهاية الفصل. 


جدول (1-3): أنماط الاستجاية المسموح بها على تدریج حوتمان لفقرات الضرب 
الأريعة من قبل المستخدمين في الدواش العامة. 





اقترح كوميس (Coombs, 1950b)‏ طريقة أخرى لتدريج كل من الأفراد والفقرات تسمی تقنية 
الانتشار. وهنا نطلب من المستجيب أن يقدر ترتيب تفضبيلاته لمجموعة مثیرات أو أن يقدر 
ترتیب مجموعة فقرات حسب مدى تقاريها مع محتقداته الشخصية «ولفهم النظرية المرتبطة 
بهذه الطريقة دعنا نفترض إن لدينا مجموعة مولفة من أربعة مثيرات مدرجة, وأن موقعها 
الحقيقي على المتصل النفسي معروف LI‏ (وذلك من خلال الاظهار). ویسمی تدريج هذه 
ol A‏ ایخ Ll dt‏ ای قري 7) إن افا plies‏ بحن pipe‏ كل من المقين والأفتراك dale‏ 
pags‏ لواقم القیرات الاربعة على ر بالحروف من A)‏ إلى (D‏ دی الشکل (۰:)1۰2-3 
ويبين الشکل )2-3. ب) النقطة التوسطة بين آزواج الثیرات» ففى هذا الشکل تشير النقطة AB‏ 
إلى النقطة التي تتوسط المثيرين By A‏ والنقطة AC‏ تتوسط السافة بين المثيرين A‏ و © وهکذا. 
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ALEE EET‏ من المثيرات المتجمعة وبالتالي توجد ستة نقاط تتوسط المسافات على التدريج. 
وهذه النقاط الستة تقسم التدريج [ إلى سبعة مناطق. ونظرياً إن كان موقع الفرد في المنطقة (1) 


عندما سال عن تقدير الترتيب للمثيرات الأريعة بالنسبةلموقعه الخاص 


J Seale‏ سا كسس سس 


{a} Placement of Four Stimuli on the } Seale 


12 4 nee CB. (1) 


J Seate 
Gi 8 2 D 
(b} Location of Midpotts on f Soale 
a yO Bee (6) (@) 


A 8 c 0 


{e} Location of Examinee X in Region 2 on J Seale 


۳ (e) 


س ی پیت ممست سيد عیب میس Me RRA‏ بیت کیا می ست میا پت کد پچ کم ست سیت ست می سينيد مه 


t@ Folding the J Seate at the Porat ¥ (د)‎ 


شكل (2-3): توضیح لوقع المثير بطريقة الانتشار لکومبس 
فانه سیعطی الاستجابات ۸ DCB‏ وهذا یکون أکثر وضوحاً إذا تخیلنا الفحوص × في 
المنطقة 2 (انظر شکل 2-3 ج). lily‏ قمنا بثني التصل عند موقع الفحوص × فإنها ستظهر 
كما في شکل (2-3د). وبذا يمكن ترتیب تفضیلات الفحوص × للمثیرات الأربعةء فیمکن 
قروو اف دو ای العمودي للمتصل كما تبين في شكل (2-3د). ويسمى ترتيب 


'المثيرات على المتصل العمودي تدريج 1 (الفرد). وفي حالة توافر مثیرات مدرجة بالضبط 





ا Oa REA‏ لمشي لان 








وأفراد مدرجين بالضبط فإنه سيكون لدينا سبعة نماذج مسموح بها ل الفرد -الاستجابة (آو 
تدريجات (I‏ واحدة لكل منطقة على تدريج J‏ وفي مثال تدريج ت I‏ السبعة الممكنة فانها تكون 





وفي تطوير التدريج النفسي لا تتوافر لدينا معرفة عن موقع المثيرات على تدريج [. وبدلاً 
من ذلك فإننا Js‏ بمجموعة تتكون من أريعة مثيرات لا نعرف إن كان بالإمكان ترتيبها Lag‏ 
فكب آن یکون علیه الى عن فعلینا محاولة عمل هذه الاستدلالات من خلال نماذج spill‏ - 
الاستجابة الملاحظة. ولتوضيح ذلك Ges‏ نعود إلى فقرات الاتجاه الأربعة حول الضرب من 
قبل الستخدمین في المؤفسسات العامة. فنحن سنفترض أن کل منها کتبت على بطاقة 

. في أن يضرب‎ Gall الدين. رجل الدين في المؤسسات العامة له‎ Jiag 

المعلمين. المعلمين في المدارس العامة لهم الحق في أن يضريوا. 

المرضات. المرضات في مستشفيات المدنية والولاية لهم الحق في أن يضريوا. 

رجال الاطفاء. رجال الإطفاء لهم الحق في أن يضريوا . 
تقدس ترئیب البطاقات وذلك بوضع الجملة التي تمثل شعورهم بدرجة أقوى في هذه القضية 
أولاً ثم الجملة الثانية وهکذا ..... فان كانت هذه العبارات قابلة للتدريج. BU‏ سنحصل من 
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خلال نمونجنا على سبعة نماذج استجابة (تدريج (T‏ وقد يشير الحصول على أكثر من سبعه 
نماذح إلى غياب قابلية التدريج المثيرات آو الأفراد أو Legals‏ (ومع الأفراد الواقعيين فإن عدد 
fall‏ من نماذج الانصراف أو الأخطاء يمكن أن تظهر). ويبين الجدول (2-3) تكرارات 
الإستجابة التي تم الحصول عليها. وبالنظر المتمعن فإن البيانات تشير إلى أنه تم اختيار 
سبعة من التدريجات الممكنة ل 1 تم اختيارها بتكرار le‏ ومنها جميعاً فإن اثنتين فقط تعد 
إحداهما مرآة للأخرى: 

رجال دين- معلمين- ممرضات- رجال إطفاء ورجال إطفاء- ممرضات- معلمين رجال 
دين. وتسمح هذه النتيجة باستدلال حول ترتيب المثيرات الأربعة على المتصلء ويمكننا الآن 
ترميز العبارات بالحروف ۸ DCB‏ لتشير إلى ترتيب أماكنها على التدريج ل. 

جدول (2-3)" التكرارات التوضيحية لأنماط الإستجابة المختلفة التي تم الحصول عليها من 
تدريج كوميس لأربعة فقرات تقيس الإتجاه نحو الضرب من قبل مستخدمي المؤفسسات 
العامة. 





(والقرار أي منها سيكون نقطة النهاية لنرمز لها بالرمز A‏ بشكل مناسب. وهنا 
سيخصص DCB A‏ لتمثل رجال الدين- معلمين- ممرضات- رجال اطفاء وهكذا فان A‏ 











1 ۲ 82: 














ترمز إلى أقل تفضيل نحو الضرب و D‏ إلى أعلى تفضيل للضربء وفحص آخر لتدريج هذه 
ا ا Seles‏ 

۳ كمد لد السوال الآتي ول سا‎ ee ic, ee be 
وفي مثالنا هذا‎ IDC و 8 أم‎ A الأريع: أي أزواج المثيرات أقرب لبعضها البعض هل هي‎ 
الاطفاء بلغة حقوقهم في‎ eg ار‎ Casale galt ت انیا کی رسال‎ 
أن نميز بأن‎ Gale الضرب؟. أولاً: تذكر أنه يوجد سبعة مناطق للأفراد على المتصل. ويجب‎ 
مواقعهم تتحدد بالمسافات بين أزواج المثيرات. وعندها يوجد أربع مثيرات فقط فإن موقع‎ 
و 8 أكبر من المسافة بين‎ A المنطقة 4 (المنطقة المتوسطة) يعتمد على ما إذا كانت السافة بين‎ 
و © أو العكس. ولنرى هذا قارن بين الأشكال (13-3) و )3-3( فالفرق بين كلا الظرفين‎ © 
ينعكس على الترتيب المقدم من قبل الأفراد في هذا التصنيف. وعلى هذا فعندما تؤدي النتائج‎ 
فإننا نستنتج أن السافة‎ BCD A مثل‎ (I التجريبية إلى نموذج إستجابة معين (تدريج‎ 
النفسية بين ۸ و 8 تتجاوز المسافة بين © و . وهذا هو الحال للبيانات الموضحة في جدول‎ 
أكبر من المسافة‎ D بالشكل (13-3). بالمقابل إذا كانت المسافة النفسية بين © و‎ atty (2-3) 
CBAD بين ۸۵ و 8 فان شكل 3-3 ب يمثل هذه الحالةء ونتوقع بالتالي نموذج استجابة‎ 


Č ABF 


اه 
> 
; 
to‏ 
8 


8 2 D 


(a) When AB > CD, and Preference Order of Respondents in Region 4 ls ۰ 


AF AC BE ADB CB 
i | 2 | 1 4 | 5 | 6 | 7 
A 8 c D 
(b) When AB > CD. and Preference Order of Respondents in Region 4 ls CAD 


شكل )3-3( مواقع الناطق المتوسطة على تدريج J‏ عندما نعكس المسافات 
بين BA‏ و CD‏ من حيث قيمتها. 
وهذا هو الاستنتاج الوحيد الذي يمكن تكوينه عن المسافة بين المثيرات في حالة أريع مثيرات 
على تدريج J‏ وفي حالة خمس مثيرات على تدريج J‏ يمكننا تكوين 12 مجموعة sab‏ عشر 
نموذج استجاية لكل منها. وباتباع الطريقة النطقية نقسها مع الثیرات الاربعة فان yal‏ 
العلومات الكافية لتحدید السافات النسبية عبر الثیرات جمیعها. ويين كوميس (Coombs,‏ 
(1950 أن هذا النوع من التداريج من الحتمل أنه یقع بين التدریجین الرتبي والفاصلي. وذلك 
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س وو 











oY‏ المسافات بين الوحدات لم تحدد بدقة» ولكن الحجم النسبي لهذه المسافات هى المعروف. 
وفي هذا JL‏ الحدود استخدمنا الفحص البصري والمنطقى لاختبار مطايقة البیانات 
للنموذج» ومع ذلك توجد اسالیب تحلیل معقدة لتحدید مدی مطابقة الاستجابات للنموذج 
التالي آنظر: (Torgerson, 1958, Ch.14)‏ 

والقاريء الهتم بالتطبیقات التخصصة لتقنيات التدریج في بناء مقاییس الاتجاهات یمکنه 
الاستعانة بمصدر مثل )1972 (Dawes,‏ و )1981 (Udinsky, Osterlind, Slynch,‏ وله وژلاء 
المهتمين بالتسلسل التارد يخي لتدرد یج الاتجاهات يمكنهم الإفادة من )1967 .(Fish bein,‏ ولتغطية 
بتفاصیل أكثر لنماذج التدري یج تجدها في )1958 (Torgerson,‏ و )1980 .(Van der Ven,‏ 


مستويات التدریج للقیاسات التمرکزة حول الفرد 


كما رأينا فإنه عندما یبنی تدریج ویختبر بهدف تدریج الثیرات أو تدریج الافراد والتیرات 


فإنه يوجد طرائق متعددة مناسبة لاختبار gall‏ التي يمكن من خلالها اعتبار القياسات رتبية 


أى فاصلية. وعند استخدام الطريقة المتمركزة حول الفرد فإنه لا توجد طريقة مناسية لاختيار 
ما إذا كانت القياسات ستعالج على أنها معلزمات من مستوى رتبي أو فئوي. 

ويقدم أحياناً دليل لدعم الإنطباع بأن بيانات الاختبار ذات تدريج فئوي هو العلاقة بين 
التدريج والتوزيع الطبيعيء ویاخذ هذا الدليل إحدى صيغتين. الأولى هو أنه عند قياس سمات 
فيزيائية على مقاييس فئوية تكون القيم الناتجة للعينات الكبيرة متطابقة مع المنحنى الطبيعي, 
ويتم الحصول Bale‏ على (fic‏ هذه القیاسات من مقاييس فترة أو فئوية. ويوجد تخطئة منطقية 
مثل هذا النوع من الأدلة. ويعد التشبث بمثل هذه الأدلة نوع من الرهان المشابه لقولنا بأن 
معظم طلبة التمريض هم من الإناث وإذا كان الطالب الجيد أنثى فقد تكون متخصضة في 
التمريض» وصيغة أكثر قوة من هذه هو المنحنى الطبیعی نفسه. فمثل هذا الدليل يأخذ بعين 
الاعتبار حقيقة أن السافة الفاصلة بين الدرجات الزائية متساوية. ويمكن الحصول على 
الدرجات الزائية من التحويل الخطي للدرجات الزائية الطبيعية (وهو النوع الوحيد من 
التحويلات المسموح به لبيانات تدريج الفئة)» ودرجات الاختبار الأصلية هي درجات فئوية. 

ویبدو أن ماغنسون (0.13 ,1967 (Magenson,‏ وافق على هذا الدليل إذ حدد gb‏ السافات 
المتساوية على المتصل والتي يمكن أن تقع على منحنى طبيعي تكون درجاتها متساوية. وعلى 
هذا يمكننا التعبير عن مواقع الأفراد على التصل النفسى على تدريج فاصلی. وأحد أوجه 
قصور هذه المواقع يبدو أنه يجب كتابة عدد كاف من الفقرات واختبار استجابات هذه 
الفقرات. ويمكننا اختيار مجموعة فرعية من الفقرات حيث يكون توزيع درجاتها قريباً من 
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التوزيع الطبيعي. وعندما تتطابق فقرات أخرى مفاهيمياً مع السمة فيجب تضمينها في 
Loss}‏ تلحصول على هذا التو وید ومن المغزة فيه انه ا معدي كجلاقة بتطقية أن 
رياضية om‏ الواقم علی التصل والدرجات اللاحظة علیه. ومشكة ثانية مع هذا الدليل یکمن 
فى أن السافات بين الدرجات الزائية قد تکون متساوية عددياً إلا آنها غير متكافئة من وجهة 
نظر نفسیة. فمثلاً ليكن لدینا صف أطفال تتوزع درجاتهم اعتدالیاً في اختبار الاستیعاب 
الات dy‏ كار ها هان السافة دن شدرات الأطفال al‏ فرح ارف عند 
baa dll‏ وراش درحتة فون اسان E‏ كوك gay als‏ فحن At‏ ااه 
بين قدرات طفل درجته 3 انحرافات معيارية دون المتوسط وآخر درجته 4 انحرافات معيارية 
بو ظاحل مون کی 

قضية أخرى مرتبطة بمناقشة التدريج الرتبي- الفاصلي في الاختبارات النفسية هو 
الاختبارات الإحصائية التي يمكن تطبيقها على البيانات. وصندوق باندوا هذا مفتوح المجتمع 
النفسي من قبل ستيفنز (1946) عندما دعم بأن: «معظم التدريجات المستخدمة بفعالية وعلى 
مدای واسع من قبل التفسیین من الخ الرتبی: فالخصاتض EE‏ لللحضائيات cal‏ 
ك القوبنطات و قاد لا نون Qala‏ سم هه getai‏ 
الاحصائیات تتضمن معرفة شيء أكثر من مجرد الترتیب النسبي للبیانات» ویلوربیورك 
(Burke, 1963)‏ موقفین لهذه القضية على آنها القیاس الوجه والقیاس الستقل. وتحتفظ 
م pull‏ التستفل Aad Shins pe jail) ebay‏ نوم من E PSL al eld ga‏ 
التي يمكن تطبيقها على البيانات. فعندما يؤكد علماء الاجتماع عدم اثبات التدريج الفئوي 
لقياساتهم. فمن الحكمة استخدام الإجراءات الإحصائية واختبارات الدلالة لبيانات التقدير 
الرتبي. ویتوافر في الاحصاء الاستدلالي مجموعة اختبارات احصائية مجمعة تحت اسم 
احصائيات لا معلمية aias (Nonparametric statistics)‏ الطرائق موضحة فى العديد من 
الكتب مثل )1977 ١ . (Marasciulo & McSweeney,‏ 


وتفترض مجموعة القیاسات الستقلة آن القیاسات التی نحصل علیها تعد اعداداً مثل 
غیرها (بغض النظر عن التدریج الاصلي). وتخضع للحسابات والتحلیلات الاحصائية التي 
a ween Ee ee ee mrt ee‏ المج عش AG‏ زموه cree‏ ارس 
الاختبارات الإختصاتية العلمية لا تتطلب القیاس علی تدریج فثوي, واکنها تتطلب افتراضات 
خول توری لاا gies Late,‏ البیانات افتر انا cas, cll‏ فان a‏ الجموما ترین Pail‏ 
داعي للتضحية بالامکانات الاحصانية والحسابات الناسبة التي یمکن تمقیقها من خلال 
الاختبارات الاحصائية العلمية.. ومن الراجع التي تفضل استخدام القیاسات الستقلة پمکن 
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إيجادها فى )1975 (Gardner,‏ وفى )1975 ERES .9 (Ware & Benson,‏ بیدو أن معظم علماء 
الاجتماع يؤيدون هذه الأفضلية. 
التلمید الدرجة 
1 37 
35 
39 


2 
3 
22 4 
5 
6 





18 
42 


فإذا أراد مستخدم الاختبار تقسيم المفحوصين إلى مجموعتين بالاعتماد على درجات 
الاختبار. وة بسهولة GG,‏ آن الطلبة 63,0 سیکونون في مجموعة والعدة:بوالطلية )5,4( 
فى مجموعة آخری. وتکمن الشكلة في تحدید موقم الطالب (2), فٍذ! اشار مستخدم الاختبار 
إلى وضعه في الجموعة الأولى لأن درجته آقرب إلى درجاتهم. فان مستخدم الاختبار یکون 
قد تعامل هم درجات الاختبار علی آنها بیاتات تدریج مكو وان وضع مستخدم لاخقبار 
الطالب في الجموعة الثانية على آساس ترتیب آعلی ثلاث درجات في مجموعة وأدنى ثلاث 
درجات في مجموعة آخری فإنه يكون استخدم درجات الاختبار على آنها بیانات تدريج رتبي. 
اي الأكفارين R‏ إن از مان على هذا Sigal‏ کاب هل رهی نمی pa‏ 
Î‏ تساه او كانت تزوجتا ats Ast Sagal‏ یی أ ونين الشف 
عنم ig lee‏ هر la Ate blah‏ بدي soad slate‏ آخری انز كانت 
مه العالمة تقال من قاکدتها او مستخممینها فائه یجب استخدام ia GM‏ الزتبی فف ود 
أن هذا الرتف ای الذي اة غه Sag E‏ تفه الذي جل اتر ارجا 
الفئوي في متناول الجميمٌ تناسی هذا يعد النقد لاستخدام الاحصاء في تحلیل بيانات 





i 4 





عليه عملياًء وفی أمثلة عديدة فإنه أدى إلى نتائج مثمرة. 


اا pini er‏ الاه تيار خن مطايقة اللاحظات لت > a‏ 
امنيا بها الناتجة عن تدريج له خصائصس saal‏ اا All‏ 
























































التمارین: 
1 حدد نوع التحویل التبم وأنواع البیاتات التي تطبق علیها هذه التحویلات: 


9 Vee 75-37 أ-‎ 
102-25 4-15 53-26 
19-19 3-18 ۱ 109-54 
5-6 0-21 57-28 
2-24 65-32 
4-15 


2/ استخدم الاستجابات البينة لعشرة آفراد على 4 فقرات من قبل المستخدمين العامين 
(أنظر إلى أنماط الاستجابة السموح بها المبينة في جدول 1-3): 





[- رتب الفقرات على آساس عدن الاستجابات الوجبة للفقرة؟ 
. ب- حدد الأفراد الذین Lal‏ استجاباتهم غير مسموح بها. 
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ج- رتب الأفراد الذين استجاباتهم مسموح بها بحيث تكون اتجاهاتهم من الأكثر إلى 

د- أي الاستجابات على الفقرات تحتاج إلى تغيير بحيث تصبح أنماط الإستجابة 
أنماطاً مسموح بها؟ كيف يمكن أن تصبح هذه المعلومات مفيدة لمطور الاختبار في 
مراجعة الفقرات مستقبلا. ۱ 

ه- ما معامل الإنتاجية لمجموعة الفقرات هذه ؟ وکیف (Sas‏ تفسیره؟ 

د- افترض أن مطور الاختبار CaS‏ 40 فقرة لتحليل التدریج» ما الصعوبات التي یمکن 
آن یواجهها؟ 

3 الموضوعات الآتية: عقاب أطفال المدرسة استخدام الأسلحة النووية فى الحروب. 
عقاب المجرمين الخارجين عن القانون. حاول تطویر فقرات عددها من 3 إلى 5 مدرجة 
لأحد هذه الواضیم. ودين ll‏ ما يجب REN‏ يعن الاعتیار لأنماط الاستجابة السموح 
بها. 

4 بعد دراسة البيانات الموضحة في جدول )2-3( أشر إلى المنطقة على المتصل (الاعداد 
من 1 إلى 7) التي يجب أن يؤشر Yale‏ الفرد ليحصل كل منهم على أنماط الاستجابة 
المشار إليها. 
ملائمة» أختر آحد الأساليب (التمرکز حول الفرد. التمركز حول الثیر. التمركز حول 
الاستجابة): 
[- باحث في التسويق يهدف إلى تقييم إقبال عشر مجلات مختلفة على منتج تجاري 

واحد. 
ب- بروفیسور في كلية يرغب في تطویر اختبار لاعطاء درجات نهائية في مساق 
الکیمیاء. 


ج- يرغب alle‏ نفس تربوي في تطویر مجموعة مسائل في الهارات الرياضية 
الأساسية باستخدام مسائل تتزايد في صعوبتهاء ويمكنه استخدامها في التسكين 
التشخیصی للطلاپ. ويهدف عالم النفس في اختباره هذا تحدید مستوی الظلبة 
التدریسی بافتراضه أن الطالب عندما يخطيء في ثلاث مسائل متتالية فإنه لن 
يحون عن اب سول ای ed‏ ی 
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الفصل الرايع 
خطوات بناء الاختبار 
لاحط في الفصل السابق أن هدف القياس في العلوم الاجتماعية والتريوية هو وضع 
الأفراد على متصل كمي وذلك للبناء النفسي القیس, ويطلق على هذا اسم القياس المتمركز 
حول الفرد. ويهدف هذا الفصل إلى وصف الخطوة التي تلي في بناء الاختبار أو المقياس 
المتمركز حول الفرد. ويركز هذا الفصل على الخطوات النتظمة في بناء الاختبار والطبقة على 
مدى واسع من الاختبارات المختلفة. وهذه الخطوات على النحو الآتي: 
1/ تحديد الأهداف الأولية التي ستستخدم فيها درجات الاختبار. 
2 تحديد السلوكات التي تمثل البناء النفسي gh‏ نطاقه. 
3/ إعداد مجموعة مواصفات للاختبار تصف بدقة نسبة الفقرات الممثلة لكل نوع من 
السلوكات الحددة في الخطوة الثانية. 
4 بناء ملف أولي من الفقرات. 
كر مراجعة الفقرات وتعديلها عند اللزوم. 
6/ تجريب أولي للفقرات ومراجعتها إذا لزم الأمر. 
7/ تطبيق الفقرات على عينة كبيرة ممثلة لجتمع المفحوصين. 
8/ تحديد الخصائص الاحصائية لدرجات الاختبار, وعند الضرورة حذف الفقرات التي 
لا تتفق مع المحكات المحددة مسيقاً. 


9/ تصميم وإجراء دراسات الصدق والثيات للصيفقة النهائية للاختبار. 


10/ إعداد dda‏ الاختبار. الذي يقيد في التطبيقات» والتصحیح. وتفسير sll‏ > ت (مثل: 
الجداول للعيارية, واقتراح توصيات مثل معابير الأداء ودرجات القطع وغيرها). 
والخطوات السابقة تمثل أقل جهد مطلوب للتأكد من أن درجات الاختبار ذات خصائص 
تطبيقية تخدم stas‏ قياس مقيدة: ويضئّمن العديد من التخصصن في ely‏ الاختيا رات 
خطوات إضافية إلى التسلسل الذکور أعلاه أو أنهم يكرروا بعض الخطوات مرات عديدة. 


تخطوات بناء RGRAY‏ 








ويهدف التسلسل المطروح هذا تقديم دليل للمبتدئين في بناء الاختبارات وتطويرها عند 
استخدامها في عمليات التقويم آو إجراء الدراسات. فالخطوات الست الأولى تعد جوهرية في 
7 إلى 10) فهي الوضوعات الرئيسة للفصول التالية في هذا الکتاب. و 


الخطوة الأولى: تحديد الأهداف التي ستستخدم فيها درجات الاختبار: ما مس 

يجب أن تأخذ الخطوات المنتظمة في بناء الاختبار بعين الاعتبار الأهداف الأساسية التي 
ستستخدم فيها درجات الاختبار. فعلى سبيل المثال افترض أنه تم تكليف خبير في القراءة 
تطوير كتاب في الاستيعاب القرائي للطلبة الذين سينخرطون في التدريس الجامعي ومن 
المؤكد أن درجات مثل هذا الاختبار ستستخدم في إتخاذ قرارات تتعلق بالقبول والتسكين 
والتشنخيص. ومن غير المؤكد أن تطوير اختبار واحد يمكن أن يحقق هذه الأهداف جميعاً 
بدرجة مثالية. وكما سنری في الفصل الخامس فإن الاختبار الذي سيميز بين المفحوصين 
"على eg es‏ افع مز ا SIERO‏ الستداسية العالنة یت أن يكلف هن وراه 
متوسطة الصعوبةء وذلك لتعظيم (تضخيم) تباين درجات المفحوصين إلى أكبر قدر ممكن. 
ومن جهة آخری» يستخدم الاختبار التشخيصي في تحديد المجالات التي یکمن فیها الضعف 
عند الطلبة ذوي القدرة المتدنية» ومثل هذا الاختبار يجب أن يتضمن عدد كبير وأساسي من 
الفقرات السهلة نسبياً لمجتمع المفحوصين. كذلك فإن الاختبار المصمم لتقييم الحد الأدنى من 
الكفاءة يختلف عن الاختبار المصمم لاختيار المتنافسين في برنامج تعليمي أو تربوي. لذلك فإن 
توضيح الأهداف الرئيسة التي ستستخدم درجات الاختبار من أجل تحقیقها» وتحديد 
الأولويات للاستخدامات المتعددة للاختبار ترجح أهمية وفائدة الاختبار للهدف الأساسي الذي 
أحد الاختیار من all‏ 
الخطوة الثانية: تحديد السلوكات التي تمثل البناء 

كقاعدة عامة تبقى الخطوات العملية التي يتم خلالها تحويل البناء النفسي إلى مجموعة 
فقرات خاصة وغير رسمية وغير موثقة وقد ناقش US‏ من كروبناخ )1970 ورويد وهالادينا 


)41980 وشسومسیکر )1975( هذه الخطوات مع تأكيدهم على ذلك خاصة عندما بتعلق الامر 
بالاختبارات التحصيلية. هذا ويُجري مطوّر الاختبار في العادة تحليلاً مفاهيمياً لواحد أو 
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أكثر من أنماط السلوك التي يعتقد يعتقد أنها تمثل البناء الستهدف, ومن ثم يحاول إعداد فقرات 
تغطى هذه السلوكاتء ولكن مثل هذا الاجراء قد ينتج die‏ حذف مجالات مهمة من السلوك أو 
احتوائه لجالات تكون واضحة فقط في fhe Jie‏ الاختبار. ومثل هذا الإسلوب ينتج عنه ذاتية 
عالية وتعريف خاص مزاجي للبناء. وللحصول على صورة واضحة منقحة وشاملة للبناء المراد 
قياسه على مطور الاختبار توظيف واحدة أو أكثر من الأنشطة الآتية: 

ار تحليل المحتوى: وفي هذا الأسلوب يواجه الأفراد بأسئلة ذات نهاية مفتوحة حول البناء 

الراد قياسه ومن ثم تصنيف استجاباتهم ضمن فئات معينة, والفئات التي تتكرر 

ثرة تعد عناصر رئيسية للبناء. وقد نشر جیرسلد )1952( نتائج تخلیل محتوی الانشاء 
وذاك من خلال وصق الأطفال لأنفسهم. > واعتمد الفئات الناتجة عن هذا الوصف 
اساسا في بناء فقرات استبانتین واسعتي الانتشار صممتا لقیاس مفهوم الذات عند 
الأطفال. 

2 مراجعة الابحاث: فالسلوكات التي تم دراستها بشكل متكرر من قبل الآخرين تستخدم 
في تحديد البناء المراد قياسه. وعلى مطوّر الاختبار أن يختار إحدى الطريقتين 
السابقتين آو أن يختار ما قدمه أحد المنظرين المعروفين في تحديد الفئات السلوكية 
التي يجب تمثيلها في فقرات الاختبار. 

3 الأحداث العرضية الحرجة: وهنا تحدد قائمة السلوكات التي تميز الأداءات المتطرفة 
على متصل البناء. ويعزى هذا الاسلوب إلى فلانجان (80,1954هعه01): Sf‏ قام بسؤال 
المشرفين على الوظائف عن وصف المواقف التي يقوم المستخدمين بتوظيفهاء وكان لها 
تأثيرٌ واضيٌ سواء أكان إيجابياً أم سلبیاء ومنها أعدّ قائمة للسلوكات الحرجة 
استخدمت في إعداد تدريج (متصل) لاذداء الوظيفي. 

4/ الملاحظات المباشرة: هنا يحدد مطوّر الاختبار السلوكات من خلال الملاحظة الباشرة, 
فمثلاً يطوّر الرشد الهني استبانة لتقييم الضغط الوظيفي في الواقف الخطرة has‏ 
وقد يجد مطوّر الاختبار الملاحظات الواقعية Jil‏ هؤلاء ماعا في تحدید الواقف التي 
تعد مصادر الجهد في الضغط الوظيفي. 

5 أحكام الخبراء: يمكن لطوّر الاختبار الحصول على مدخلات ممن هم خبراء أوائل في 
البناء نفسه. وذلك من خلال استبانات مكتوية أو لقاءات شخصية لجمع المعلومات. 
ومثال ذلك Say‏ للمتخصص في ale‏ نفس الشخصية أن يطوّر قائمة لتدريج أداء فريق 
التمريض في مستشفى كبير من خلال تغطية أو مسح لمجموعة المشرفين على 
التمريض يتم من خلالها تحديد أنواع الأداءات التي يجب أن تتضمنها. 
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6/ الآهداف التدردسیة: لتطویر اختبار تحصيلي يتم سوال الخیراء في الوضوع لراجعة 
المحتوى وكذلك لتطویر مجموعة من الأهداف التدريسية التعلقة بالوضوع نفسه. 
فالأهداف التعليمية تخصص السلوك الملاحظ الذي یمکن أن بودیه الطالب بعد اتمامه 
للمساق التدريسي, ومثل هذه الأهداف تعمل کشبکة وصل لكل من الحتوی الذي يجب 
التركيز عليه وطبيعة المهام التي يجب أن يكون الفحوص قادراً على آدائها . والوصف 
التفصيلي لعملية تطویر الأهداف متوافرة في معظم کتب القیاس مثل (Popham, ataga‏ 
)1981 ویراون )1983 (Brown,‏ ومبرنز ولیهمان )1984 .(Mehrens & Lehman,‏ 


Domain Sampling معاينة المجال‎ 


هنالك بناءات نفسية يكون الاهتمام بها أولي مثل الذكاء والإبداع والتطور الخلقيء إذ أن 
الأفراد يختلفون في كميات هذه الخصائص التي يمتلكونها. ولتطوير اختبارات Bale‏ تجري 
عملية تحليل مفاهيمي لعناصر السلوك الرئيسة للبناء ثم إعداد فقرات لعناصر السلوك هذه 
وأخيراً اختيار الفقرات التي ثبرز التباين المتوقع في الأداء. فالفقرات ذات التباين النخفض 
تحدف من الصيقة النيائية LAT‏ لا تمال البثاء يشكل مناسب. ولان درجات الاختبارات المبنية 
بهذه الطريقة تفسر بمقارنة أداء الفرد بأداءات الآخرین, لذا يطلق على هذه الاختبارات اسم 
معيارية ees‏ اسن يت 

كذلك» ففي مواقف Suc‏ بلزم قياس أداء الفحوصین بمستويات أكثر تجريداً كما هو الحال 
في الاختبارات التحصيلية. وذلك عندما يهدف مستخدم الاختبار التأكد من امتلاك الفحوص 
حد أدنى من الكفاية في موضوع معين أو عند تقويم فاعلية برنامج تعليمي. واقترح إيبل 
(Ebel, 1962)‏ فى مثل هذه الحالات الحاجة إلى days‏ معيارية للمحتوی (Content standard‏ 
Score)‏ بکرم ذات معقى مهدر التفموص gail‏ النظر عن ازاء الا شرین على الأختنان وقد 
اقترح )1963 (Gleser,‏ استخدام مصطلح القياس Sao‏ المرجع على clays‏ الاختبار 
التي تشتق معناها من الستویات الطلقة للمفحوصین من خلال استجاباتهم على سلسلة 
ققرات ee‏ کل مجموعة منها مستوی معروف من LUSH‏ وذلك على مجك الأهمية (Criter-‏ 
of importance)‏ 102. والاسلوب المذكور سابقاً فى أجرأة البناء لتطویر اختیارات لادهد اف 
EE geal‏ الت تیم طن ارات اسان حكن الم مها 
من الأهداف التدريسية يحدد من خلالها مجالات الأداء التى يمكنه من خلالها تكوين 
استدلالات من DLA‏ درجات الاختبار. ویطاق علی مجال الاداء هذا سم مجال اترات 
(Hem domain)‏ يعد مجال الفقرة مجتمعاً محدداً جيداً من الفقرات يمكن من خلالها بتاء 
فة اختبارية أو آکثر وذلك باختیار عينة من الفقرات من هذا الجتمم. أو يطلق على هذا 
أحياناً أسلوب معاينة الجال في بناء الاختبار. 
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l =‏ 
" ومن الواضحء صعوبة توليد الفقرات الممكنة جميعها للمجالء لذا فان استخدام عدد قليل 
منها بعد اقتصادياً لكنه غير to’‏ في مجالات عديدة. وكبديل لانتاج مواصفات فقرات المجال 
وألتی تعد بصورة تجريدية ومنها كتابة الفقرات على وفق هذه المواصفات هنالك مراجعة 
. واسعة مكثفة للأساليب المقترحة لتحديد مجال الفقرات ثم كتابتها عرضها كل من ميلمان 
(Millman, 1974)‏ ورويد وهالادينا )1980 ig (Royd & Haladyna,‏ شومیکر )1975 (Shoemaker,‏ 
ومن الأساليب واسجة الإنتشار ما يُعرف باسم مواصقات الفقرات (Itemspecification)‏ أو 
مأ يسمى بالهدف الموسع أو المضخم (amplified See)‏ وخصائص الفقرات كما Jaa‏ 
(Popham, 1974) alaga‏ تتضمن مصادر محتوي col all‏ ووصف الموقف المثير أو ALA‏ 
وخصائص الإجابة الصحيحةء وفي TTA‏ الاختيار عو فان ی ME‏ | لاشتهانات 











الخاطتة: وال pa‏ (1-4) يبين مثال توضيحي. 





المهارة الفرعية ‘Subskilll‏ يظهر قدرة (يبين قدرته) في ضرب الكسور العشرية. 
توصيف الفقرات Item descriptor‏ ضرب الكسور العشرد ية: الحساب. 


1 تتطلب السالة ضرب کسرین عشریین» کسور 
و/آو کلاهما. 


2 السالة يجب أن تکتب في جملة أو صيغة أفقية, 
وعند استخدام الصيغة الأفقيةء التعليمات يجب 


أن تطلب: جد الناتج أو اضرب. 
3 أحد العوامل (الاعداد) يجب أن يتكون من ثلاثة 
منازل غير صفرية: والآخر يجب أن يتكون من 


عشرية واحدة. 


5 يجب أن لا تتضمن الإجابة أكثر من 4 منازل 


عشرية. 

6 من الضروري إجراء عملية إعادة تجميع (re-‏ 
grouping)‏ مرتين على الأقل. 

7 عند اختيار (factors) Sol gall‏ لا يجب استخدام 
الکشر العشري ASÍ‏ من مرتين. 


1/ الصيغ 
كل الاختيارات العددية يجب أن ترتب حسب 
المنزلة العشرية وترتب إما تصاعدياً أو تنازلياً. 
2/ عرض أريعة بدائل للإجابة: . 
[- الإجابة الصحيحة. 
gial‏ الإجاباث الخاطئة يجب أن تعكس خطأ 
فى إعادة التجميع أثناء عملية الضرب. 
جب إحدى الإجابات الخاطئة يجب أن تعکس 
خطأ ترتيب أثناء عملية الضرب. 
د- sal‏ الإجابات الخاطئة يجب أن تعكس اما 
(a)‏ حذف إشارة الکسر العشري آو iha (b)‏ 
قي تحدید موقعها. 
3 إجابة أخرى ممكنة Yr‏ شيء مما ذكر» یمکن 
أن يحل محل أ أو ب أو ج. وهذا البديل يجب 
أن يظهر في البديل الرابع (د). 





شكل (1-4). خصائص فقرات اختبار في المهارات الرياضية الأساسية. 











جامعة فلوريدا. 

ويكون لاستخدام خصائص الفقرات مزايا جيدة خاصة عند إعداد ملف اختباري کبیر. 
وتراجع فقراته من قبل عدد من المختصين في GUS‏ الفقرات: وعندما يكون هؤلاء ضالعين في 
توصیف الفقرات يمكن توليد عدد كبير من الفقرات المتوازية التي تقيس هدف معين ويفترة 
وجديزة. وعلاوة على ذلك فإن استخدام عدد من المختصين فى LUS‏ الفقرات لفترة زمنية غير 
قصيرة فإن مواصفات الفقرات تؤكد على أن صيغ الفقرات الحالية تكافيء تلك المستخدمة في 
ع هناك ا خرف هر کی التضبل اخ etl‏ الفقر ان ابا Ge‏ خلال EAE RE‏ 
(item algorithm)‏ آو صيغ الفقرات (item forms)‏ ويطبق مصطلح الفقرات العددية على 
الأغلب عندما يكون محتوى الفقرات كمياً. بينما يستخدم المصطلح صيغ الفقرات عندما يكون 
محتوى الفقرات لفظياً. لتوضیح الفقرة العددية. تفحص الهدف: ; 

- أن يتمكن الطالب من حساب الفرق بين أي عددين موجبين في الصيغة Í)‏ - ب = 7( 
عندما يكون أ > ب. هذا ويمكن تكوين عدد كبير من الفقرات بهذه الصيغةء وذلك بتعويض asd‏ 
مختلفة لكل من )1 و ب)» ومجال الاجابة قد يكون عدداً واحداً أو مجموعة متنوعة من الأعداد. 
NG ual‏ همون واا از SSE‏ حن الا التشيزة: بصن هوه ill‏ 4 فكة علية م 
الفقرات اعتماداً على مجموعة من عناصر الإحلال: وتعويضها في العنصر المعرفي لأرومة 
الفقرة. وأمثلة من هذه الفقرات: 

عندما يظهر على شجرة الحمضیات أءفمن المحتمل أن هذا من أعراض : 

1. نقص الغذاء. 2. ضرر عشبي. 

co‏ عدوی د بکتیر دة. 

وقي المجموعة )( یمکن ULES‏ آعراض تظهر على الورق واللهاء مثل اصفرار الورق. 
تشسقق cetati‏ بقع صدا gli‏ الأوراق» سناچ أسود على الأوراق» تقشر ela sekati!‏ 
الفسیفساء أو ترقيط الورق بألوان مختلفة. تقرح وتاکل اللحاء والاجابة الصحيحة لهذه 
الفقرة تتغیر تبعاً للعنصر () الذئ سیستخدم في آرومة السوال. 
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وأسلوب أكثر بنيوية more structured‏ لخصائثص النطاق ومشابه لاستخدام صيغة 
الفقرة يستخدم جمل خرائطية (mapping sentences)‏ التي تحدد Weeks‏ أجزاء الكلام أو 
(speech) Jai!‏ وآشباه الجمل. والشروط التي تتغیر بشکل منتظم والتي تتحدد بمواقع معينة 
من الجملة ضمن تركيبها أو بناءها. وقد اقترح جوتمان )1969 (Guttman,‏ استخدام الجمل 
الخرائطية كجزء من نظريته (facet theory)‏ وذلك في تحدیده لخصائص الفقرات فى 
الاختبارات المعرفية أى إستبانات الإتجاهات التي قد تؤثر على نمط الإستجابة. وناقش كل من 
ديرك )1978 (Berk,‏ وميلمان (1974 (Millman,‏ تطبيق الجمل الخرائطية في تعريفهم للنطاق. 
واقترح بورمث )1970 (Bormuth,‏ أسلوياً فى تحويل القواعد عند بناء فقرات الاختبار بالإستناد 
إلى مقالة مكتوبة, وهذه تشبه أسلوب الفقرة- الصيفة ‘Gitem-forms method)‏ : 


وعند الأخذ بعين الإعتبار مستوى التخصيص عند تحديد النطاق فى موقف معين يجب أن 
تؤخذ النقاط الآتية بعين الاعتبار: 
هذه الفقرات a‏ الآداء علي نطاق السلوك SL Sill ET‏ ومن الواضح هنا أنه كلم OS‏ 


= 









النطاق محدداً بشكل واضح وجلي وتخلي معد الفقرات عن الذاتية في اختياره لصيغ 
الفقرات ومجتواها كلما كانت ثقة مستخدم الاختبار بأن الفقرات المستخدمة في صيغة معينة 
للاختبار تمثل النطاق (بمعنى أنه عند بناء صيغة أخرى للاختبار فإنها تكون ممثلة للاختبار 
الأول بشكل دقیق). وعندما يصبح النطاق محصوراً ومحدداً فان إمكانية التعمیم وبثقة على 
النطاق التضمن لجال محدد جداً من السلوك يكون مناسباً جداً في بعض القياسات» ولکن 
یکون عليه تساژلات في مجالات قياسية آخری. ۱ 

ثانياً: قضية مرتبطة معتمدة على تخصیص الفقرات فى خفض الذاتية عند استخدامها في 
اختيار صيغ الفقرات ومحتواها ore‏ عبسل تا قرار ذاتى فى كتابة الفقرات إلى 
الحد الذي تم تخصیص الفقرات فیه. كت" 

dats‏ إذا كانت نتائع تخصیص معين للفقرات آدت إلى إنتاج فقرات مطابقة لفقرات 
ضعيفة تقنياً أو متأثرة بمجموعة الاستجابات, فان الاختبار یکون متضمناً نسبة كبيرة من 
الفقرات الخاطتة والتي قد تظهر فيما لو أن كتبة الفقرات لم یلتزموا في اتباعهم لواصفات 
الفقرات. ومن الهم Lad‏ مراجعة خصائص الفقرات قبل استعمالهاء وعند تطوير فقرات 
عديدة لكل توصیف للفقرات على آسس استدلالية» إذ یصبح اکتشاف الضعف آو التصدع 
في الفقرات ممکناً. ش 
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إعداد مواصفات الاختبار Preparing Test Spercification‏ 
بعدما يتم اختيار الأهداف وخصائص الفقرات وفثات السلوك الآخری فان مطور الاختبار 
یحتاج إلى صياغة خطة لاتخاذ قرار بالتاکید على أن کل العناصر متضمنة في الاختبار. 
وبالتحدید يجب أن يكون هنالك توازناً لفقرات المثلة لعناصر الاختبار بنسبة آهمية ذلك 
العنصر من وجهة نظر مطور الاختبار. وعندما یکون نطاق الفقرات محدداً من خلال مجموعة 
خصائص الفقرات تصبح القضية: ما عدد الفقرات التی يجب أن تمثل کل تخصیص 
للفقرات. وبدون وجود خطة معينة فان الصیغ التتابعة للاختبار والناتجة عن الخصائص 
نفسها للفقرات قد تکون مخثلفة جوهرياً عندما يؤكد معدو الفقرات على بعض الخصائص 
دون غیرهاء كذلك فإن الجالات التي يتم التأكيد علیها قد تختلف من صيغة لأخری. وفي حالة 
اکثر وها عندما لا یکون هنالك اعداداً لخصائص الفقرات فان تطویر خصائص الاختبار 
یتطلب من مطور الاختبار أن یهتم بخاصیتین للفقرات وياستقلالية لكل منهما عن الأخرى- 
الحتوی والعملیات العقلية أو الإجرائية التي يستخدمها الفحوص في حل الهمة الطلوبة في 
الفقرة. وهذا مهم جداً خاصة في تطویر الاختبارات التحصيلية. وکما هو مبين في الثال 

الاتي: 
افترض الأهداف الآتية في الهندسة الستوية وفي الوحدة التعليمية نفسها. 
/ حدد الصطمات الأساسية الرتبطة بالداثرة Jie)‏ نصف القطرء الحیط. الزاوية 
الرکزیة). 
ب/ إحسب قياس الساحات. السافات» محیط Shpall‏ الزوایا التي تقاس باستخدام 
زا سر از ره 
من الواضح أن الهدف الأول یتطلب استرجاع العلومات الخزونة في الذاكرة. في حين أن 
الهدف الثاني يتطلب معرفة هذه المفاهيم وتطبيق المباديء التي تحدد العلاقة بين أثنين أو أكثر 
من هذه gral atl‏ انلك فان التخصیص البسیط للمحتوی ودون الإشارة الى مستویات أن 
أنواع العملیات للعرفية التي يجب تمثیلها في فقرات الاختبار, لا یزودنا بدلیل مناسب في 
باه الختا 
وقد اقترح العديد من المؤلفين نظاماً هرمياً في تصنيف العمليات المعرفية التي تعد مهمة 
في تطویر خصائص الاختیار. والأكثر شیوعاً وشهرة في هذه التصنیفات تصنیف بلوم 
(Bloom, 1956)‏ والمؤلف من الفئات الرئيسة الآتية: 


an j‏ استرجاع الحقائق لذکورة في المادة یه بصيو ساني لطي يقة التي 
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2 الفهم أو الإستيعاب - الترجمةء التفسير أو استقراء المفاهيم بطريقة مختلفة عن 
الطريقة التي عرضت بهاء وهدف من هذا ال fei‏ في جمل لم 
تستخدم في الأمثلة المطروحة في الصف. أى تقديم مثال لعدد أولي غير الذي عرض في 
الضف او الكتاب الدرسي. 

3 التطبيق- حل مشكلات جديدة من خلال استعمال مبادئ أو تعميمات مألوفة. مثل 
حساب مقاومة موصل كهربائي باستخدام قانون آوم. وذلك عندما لا يبين السؤال 
القانون اللازم لحل المشكلة. 

4 التحليل- تحليل المعلومات آو المشكلة إلى عناصرها باستخدام عملية تتطلب معرفة 
عناصر متعددة وكرأى مباديء تنظيمية و/آو عير هذه العناصر. مثل تحديد جنس عينة 
جديدة من النبات من خلال خصائص أوراقها وأزهارها. 

5 التركيب- جمع العناصر في وحدة باستخدام البناء الأصلي of‏ حل مشكلة تتطلب 
اتحاد مجموعة من المباديء بتسلسل في موقف روائي. مثل GUS‏ برنامج محوسب 
يجري حسايات لمجموعة بيانات مسجلة باستخدام مدخلات» مخرجات. ale‏ 
تحویلات منطقية لجمل بتسلسل فعال في الاجراءات. 

6 التقویم- وذلك باستخدام محك (یولده ذاتياً) داخلي أو خارجي لاصدار أحكام بلغة 
واضحة ومنطقية من وجهة نظر فلسفية أو آدبیة. مثل LBS‏ مراجعة نقدية لمقالة صحفیة 
تصف بحث آولي في ale‏ النفس الاجتماعي gh‏ الشخصي. 

وقد زودنا بلوم وزملاؤه )1971 (Bloom, etal,‏ بتفسیر إضافي وأمثلة لهذا التصنیف. 

والأمثلة الإضافية لتصنيف العملیات الطوبة في اختبارات الأداء الأمثل- أقصى أداء - التي 
وصفت من قبل إيبل )1972 (Ebel,‏ واقترح ها ئا اهر Pron prc‏ جات 
لاسترجاع حقائق المادة التعليمية. واستخدام التعميمات والتفسير والحساب وتنبق النتاجات 
والتوصيات. كذلك قدم فورندايك وهاجن )1977 (Thorndike & Hagen,‏ ا lia!‏ تمييز 
المصطلحات والألفاظ وتحديد الحقائق. وتحديد البادي». والمفاهيم والتعمیمات وتقويم 
المعلومات» وتطبيق المباديء في المواقف الجديدة أو غير المألوفة. وفي الأغلب فإن معد الاختبار 
يختار عدداً قليلاً من العمليات المذكورة في واحد من التصنيفات أو أنه يجمع بين فئات من 
أكثر من تصنيف في تغطية الحاجات الخاصة بالاختبارات. 
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العمليات التي يجب تمثيلها في الاختبار. كذلك فإنها تؤشر للتوازن الذي يجب الحفاظ عليه 
في اختيار العمليات الختلفة في الاختبار ككل. وأحد التراكيب الهمة لواصفات الاختبار التي 
اخا حو A‏ من الح EPN‏ تدرف مهنول elect‏ يكلف هوا ار 
من بُعدین على الاقل. یتضمن الأول مجالات المحتوى الرئيسة والآخر العمليات العقلية. ويبين 
الشكل (2-4) جدول توضيحي لمواصفات اختبار فرعي لامتحان شهادة كفاءة المعلم. (هذا 
الثال يوضح مستويات عقلية مختارة من أكثر من تصنيف على الأرجح). والعدد الموجود في 
كل خلية يُعد الوزن المناسب المؤشر للأهمية النسبية الذي یومل أن يكون ضمن الحتوی 
والعملية المرتبطة بتلك الخلية. ففي الاختبارات التحصيلية تعكس الأوزان في الخلايا الزمن 
اللازم للسيطرة على المادة التعليمية أثناء تدريس المساق. ويجب أن يكون مجموع أوزان 
الخلایا مساویاً (100). وکل وزن يقن نسبة الفقرات gf‏ الدرجات فى الاختبار الخصصة 
للمحتوى والعملية. ومثل هذه الأوزان تحدد عده الفقرات التي يجب کتابتها لتمثل الخلية 
بشکل مناسب بالنسبة للمجال الذي نهتم به. وفي الشکل )1-4( فان %1 من الفقرات يجب 
أن تقيس استرجاع مباديء تنظيم الغرفة الصفية و %10 يجب أن تقیس تطبیق مباديء 
تنظیم ألغرفة الصفی1. کذلك Gage‏ جدول الواصفات بطريقة مناسبة لوصف الاختبار 
للمهتمين باستعماله وتطبیقه. وعند جمع النسب في کل عمود نجد أن %7 من فقرات الاختبار 
تقیس مهارات مستوی العرقة و %62 منها تقیس مهارات التطبیق و %31 منها تقیس 
مهارات حل الشکلات. ویجمع النسب في کل صف نستخلص النسبة المئوية الكلية الفقرات 
التي تغطي فئة كل محتوی على التوالي. وعندما يقرر معد الاختبار عدد فقرات الاختبار الكلي 
فان عدد فقرات کل خلية التي تحقق جدول مواصفات الاختبار تساوي وزن الخلية مضروياً 
بعدد الفقرات الکلي. ۱ 

وفي استبانات الاتجاهات أو الاداء اللاحظ فإن معد الاختبار یستخدم سلوکات من الجال 
الاتفعالي في اعداد جدول مواصفات الاختبار. وقد قدم کل من كراثول وزملاژه (Krathwohl,‏ 
etal., 1964)‏ تصنيفاً قد یکون مفيداً لهذه الاهداف, وتجد في موّلف بلوم وزملائه )1971( وصفاً 
Wes‏ اتويات التصنیف الخمسة التي اقترحوها وأمثلة على استعمالاتها في تطویر 
PES]‏ 
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شكل (2-4): جدول مواصفات اختمار فلوریدا لكفاءة المعلم 


ختبار فلوريدا لكفاءة المعلم 1-2 Teacher Certification Examination‏ . 


استخدمت بإذن من قسم التربوی فى جامعة فلوريدا Florida department of Educ‏ 
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Item Construction الفقرات‎ eli 


وصف لیندکویست )1936 dago (Lind quist,‏ مطور الاختيار بأنها تتطلب نوعين رئيسيين من 
القرارات المهمة - ماذا ستقيس وكيف ستفيسة؟ وخلال al elias‏ يجيد عفر النوع 
الأخير من القرارات. ويتضمن بناء مجموعة من الفقرات التي تقيس بناءاً معنياً الفعاليات 
الآدية: 

2/ إثبات أن الصيغة المقترحة ملائمة لفئة المفحوصين. 

4 كتابة الفقرات. 

5 مراقبة تقدم معدي الفقرات ونوعية الفقرات. 
أصياغة of Ball‏ أو مواصفاتها . وعندما لا تستخدم مواصفات الاختبار یبقی من الهم اتخاذ 
اقرارات حول صيغ الفقرات عند بناء الفقرات عوضاً عن ترکها لأذواق معدي الفقرات 
Aol alts‏ وعند اتحاذ قرار حول dance‏ معينة للفقرات یوّمل من مطور الاختبار مراجعة 
oof gull‏ المشابهة فى الجال» ودراسة التقاریر العدة عن تطويرهل وقد یکون آراء الخبراء 
مساعداً فى تقریر مثل هذه الأمور من مثل ما إذا كان الفحوصون مژهلین لدرجة كافية 
وقتاً فى كتابة إجابات الأسئلة ذات النهاية الفتوحة آو ما إذا كان طلبة الصف الثالث يمكنهم 
جمع بیانات على مدی ضیق باستخدام عدد قلیل من نموذج الفقرات الأصلي للإجابة على 
مثل هذه الأسئلة وذلك قبل إعداد suc‏ کبیر من الفقرات بالصيغة نفسها. 





Ulag aad‏ يتم اختیار صيغة معينة من الفقرات فان مطورٌ الاختبار يجب عليه مراجعة الصادر 

القياسية -المعيارية- فى GUS‏ الفقرات GALS‏ بعين الاعتيار المقترحات اللازمة فى GUS‏ فقرات 

من هذا النوع. وقائمة هذه الإرشادات يجب إعدادها وتوزيعها على كتبة الفقرات خاصة 
-_ سی 

Item Formats for Optimal Performance Tests صيغ فقرات اختبارات أقصى أداء:‎ 


لاخبتارات أقصى أداء (المعروفة باختبارات الاستعدادات أو التحصيل) يمكن اعتماد (ote‏ 
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من الفحوص GUS‏ الإجابة (صياغتها) (مثل أسئلة المقال أى الإجابات القصيرة) وتلك التي | 


تصحيحها بذاتية ضعيفة فإنة يطلق عليها إسم فقرات اختبار موضوعيةء والصيغ الثلاث 
الأكثر إنتشاراً فى الأسئلة الموضوعية هي: 
1- اختبار البديل:ع01016) Alternate‏ 
جملة أو سؤال لها استجابتان محتملتان (صح ~ خطا) أو (نعم - لا). ۰ 
2- اختمار من متعدد: Multiple Choice‏ 
أرومة يقدم فيها السؤال أو تطرح مشكلة؛ والإجابة الصحيحة أو مفتاح الإجابة مع أثنين 


أو أكثر من الاستجابات الخاطنة التى تسمى أخطاء foils-‏ 


أ- ضرر عشبي © , ب“ عدوى بكتيرية 


>= هجوم الحشرات د- نقص الغذاء 


Matching المزاوجة:‎ -3 

تستعمل جملة المبدا في ريط الأشياء من قائمتين منفصلتین, قائمة من المثيرات أو القدمة 
النطقية» وقائمة من الاستجابات. ۱ 

مثال: لكل علاقة مذكورة في القائنة ark‏ سل :رمز السبب الاک ese‏ لد من القائمة 
اليسرى: 


العلامة السيب المحتمل 
اا ا أ. التعرض للطقس البارد 
2- تشقق اللحاء ب. نقص النيتروجين 
3- بقع صدأ على الأوراق ١‏ ج- عدوى فطرية 
4- أوراق مرقشة (Ande)‏ د- ضرر عشبي 


ه- عدوى فيروسية 
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gy (Popham, 1981) و‎ (Mehrens & Lehman, 1984) و‎ (Brown, 1983) هذه الأسكلة مثل‎ fin 
ونقطة مهمة فى صياغة الأسئلة الوضوعية بأشكالها كافة هو أن تظهر جميع‎ (Sax, 19 
الاستجابات مقبولة منطقیاً من قبل آلفحوصی الذون آدیهم العرفة اق الهارة التي صمم‎ 
الاختبار لقیاسها. وکمثال في فقرة الاختیار من متعدد الارومة الکتوبة جیدا یتیعها الاجابة‎ 
الصحيحة وثلائة بدائل خاطة التي لا تقیس معرفة الفحوص في الجال الطلوب. ومعظم‎ 
pial site Teall UL هوا‎ Peer المفحوصين لديهم القدرة على حذفها‎ 
وكنتيجة تنخفض قيمة الفقرة. تقلب علی مغل هذه الشکلة فانه یتم بناء البدائل الخاطثة من‎ 
رها ا‎ E جه ا‎ N BRS ی اش اش یا زو‎ ca 
مطور الاختبار أن یتذکر بأن بناء الفقرة الجيدة یتطلب لیس معرفة الحتوی فقط ولکن معرفته‎ y 
بمجتمم المفحوصين للتأكد من أن الاختیارات الخاطنة تبدو معقولة.‎ 

وك فاه ينصح لون | | سار اه إغطاء أفدية تیار سید oil Sa‏ الاق 
a es‏ هی A‏ مناناة 
باستخدامها TENS‏ ادك البعض بالتحول عن صيفغة أسئلة الاختیار من متعدد ذات 
الشعبية العالية. وفي الوقت نفسه هنالك اتّجاهٌ ينادي باستخدامها من Yo‏ أخرى. فمن جهة 
7 تادى Ehel, 1982) duf‏ بالاستخدام الواسع لفقرات ببدائل Lass A‏ كمثال : كثافة الثلج 
بر 2 آقل من GES‏ الام. ووجهة نظره أنه في مجالات عديدة Sey‏ التعبیر عن العرفة 
على شكل سلسلة من العلاقات الوظيفية أ المبادي» وان كل منها يمكن أن يكون الأساس 
ة أكثر بناءاً أو تركيباً. مع ذلك يبدو أن كل فقرة تستطيع اختبار قدر قليل من العلومات 

وقد ناقش إيبل كل من: 












1/ يمكن طرح عدد كبير من هذه الأسئلة في وقت قصيرء مما يسمح بمعاينة قدر أكبر من" 


محتوى النطاق في الاختبار. 
2/ الأداء على مثل هذه الفقرات يكون أقل تأثراً بالعوامل الدخيلة مثل المستوى العالى من 
القدرة القرائية والتي تكون مطلوية بالصيغ الأكثر تعقيداً 
Ba‏ هذه الآ عرز اک ما فا tek ps Sagal!‏ ما شاوی عله أي 
ومن جهة أخرى اقترح فبرسدريكسن )1981 Fredriksen,‏ : من أجل فاعلية تصحيح أكير أن 
مطوري الاختبارات يجب أن يركزوا كثيراً على الصبيغ المركبةء والذي يجب أن يتوافر في 
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ومعظم کتب مقدمة في الاختبارات والقیاس تقدم من خلال فصول عدة مقترحات لكتابة . 





















































سے Let wel‏ فس سا زین ee Cp‏ تی رک ند طلم pA‏ ها به مرا قوم ا و a7‏ 
و هت تقس gt‏ و Ser‏ ل بہ م Ans Gyo Hie‏ ار چاه سیا MU Sew aa‏ 
كيد فرمطه الما یا روصت AREA‏ و الشاهف 


“Ato 


الكثير من القدرات المهمة وبالتالي غير متعلمة. وأحد البدائل التي اقترحها فريدريكسن هنا 


هو تطوير مهام حل مشكلة غير مركبة متعددة البدائل. وتم وصف أعمال أكثر حداثة ذات ٠‏ 


علاقة بمثل هذه الاختبارات طرحها وارد وكارسون ووين تشلجر (Ward, Carson, Woisetsch-‏ 
lager, 1983)‏ وفی الوقت نفسه طرح قضية ما لو إذا كانت الفقرات التی تغطی الحتوی نفسه 
ویاستعمال صيغ بديلة تقیس Iad‏ السمة نفسها لم Jas‏ بشکل حاسم ومقنم» زیبدو أن 
القضية لا زالت في تقدیم مقترحات نظرية وأخرى امبريقية. 

Item formats for Inventories صياغة فقرات الاستبانات:‎ 


هنالك صيغ ثلاث شائعة لاستبانات الشخصية والاتجاهات هي صيغة موافق - غير 
موافق» صيغة ليكرت, الصيغة الوصفية ثنائية الاقطاب. وفيما يأتي وصفاً لكل منها: 


تتألف صيغة موافق- غير موافق على الأغلب من جملة تقريرية متبوعة باختيار واحدة من. 


الاستجابتین. وهذه الصيغة موضحة بالفقرات الآتية: 


1 يجب أن يطيع الأطفال الوالدین دون أي سؤال موافق غير موافق 


2 يحتاج أطفال اليوم لضبط أقوى في البيت موافق غير موافق 
ريدو سكعل ey‏ لديل المعو مس اوت شوک le‏ ا 
الوالدي موافق غير موافق 


سيُعطى الدرجة العالية aly‏ سيعطى الدرجة المنخفضة. فمثلاً للفقرات المذكورة آعلاه. يمكن 
وف الإتجاه على متصل يتراوح بين الإخضاع الكامل والتساهل من وجهة نظر والدية. وهنا 
يتوفر لمطور الاخثبار فرصة لتخصيص المستجيب الأكثر سلطوية على أنه الذي يحصل على 
درجة أعلى على الأداء أو ان المستجيب الأكثر تساهلاً يحصل على الدرجة الأعلى. دعنا 
نفترض أن مطوّر الاختبار يرغب أن تعكس الدرجات الأعلى للاتجاه الأكثر تساهلاً. بعدها يتم 
تحديد الدرجة التي تستحقها كل فقرة (إيجابية of‏ سلبية) بالنسبة للبناء. وفي مثالنا OF‏ 
التصل مرف بلغة التساهل فان الفقرتين 1 ۰ 2 تعد سلبية والفقرة 3 تعد إيجابيةء وتصحيح 
الفقرات بإعطاء درجة واحدة لكل استجابة بالموافقة للفقرة الإيجابية. ونقطة واحدة لكل 
إستجابة بعدم الموافقة للفقرة السلبيةء وعلامة المستجيب الكلية هي مجموع درجاته على 
الفقرات جميعها. وفي الثال الحالي المستجيب الذي أشر غير موافقء غير موافق» موافق 


: والطريقة الأسهل لاعطاء الدرجات لثل هذه الفقرات هو تقرير أي طرفي متصل الاتجاه 
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للفقرات 2:43 5) علی التوالي قرت سیحصل علی الدرجات (1,1,1) ومجموعه 3 درجات. 
ومستجیب آخر آشر على غير موافق» موافق. غير موافق یکون نمط درجاته )0,0,1( 
ومجموعه days‏ وأحدة. 






وطريقة بدبلة اتصحیح فقرات صيفة موافق- غیر موافق padded‏ وزان الفقرات. فکل 
فقرة يؤشر لها Lords‏ موزونة بحسب قوة التعبیر الوجداني- الانفعالي- نحو البناء الذي 
تقیسه. کذلك قان هنالك طرائق عدة تستخدم في الحصول على آوزان الفقرات. والطريقة 
إلأكثر شيوعاً هي طريقة القترات التساویة- القياس الفاصلي- الذي وصفه ثیرستون (Thur-‏ 
fila, stone, 1928)‏ بعد كاثي الققرات مد كيرا من الفقرآت (اقترح فیرستون حوالی 
0 فقرة) تتراوح بو موجب متطرف إلى سالب متطرف بالنسبة البناء القیس. بحیث یکون 
بعضها ذو تأثير متعادل. وقد تکتب كل فقرة على بطاقة منفصلة, وتعيض مجموعة الفقرات 
عل مجموها من العکمان اددویجها على eats‏ الفثرات الدساویه gully‏ من كل مبحکم 
E EA‏ مها على بسا متهكوا الى :7 AE‏ مكداز فى السافات 
الفاصلة بينها. وعلى المتصل المؤلف من 11 فترة تقع الفقرة المتعادلة في الفئة و الفترة 
السادسة. 





وتحقق البيانات المستخلصة من عملية التحكيم هذه هدفين - الأول اختيار فقرات الصيغة 
النهائية للمقیاس وتأشير الأوزان لكل منهاء ورن الفقرة هو وسيط تقديرات المحكمين. وعلاوة 
على ذلك تختار فقرات المقياس من المجموعة الكلية الفقرات على أساس إحصائي مثل 
:Semi- interquartile range Q‏ 0 
sf Q‏ اكد 
2 


حيث ان م75 هو القيمة العددية للرتبة المئينية 75 

0 م25 هو القيمة العددية للرتبة المئينية 25 gah‏ التوزيع. 

وكلما كانت قيمة © أقل كلما كانت الأحكام متفقة بدرجة أكبرفي قوة الإنفعال المعبر عنه 
بالفقرةء وهذه الفقرات هي الأفضل في تكوين المقياس. ومع ذلك فان مطوّر الاختبار يحاول 
تضمين المقياس فقرات من كل فنّة تصنیف. وعندما يطبق المقياس على المستجيبين Lord‏ بعد 
(وفي كل تطبيق) يقر كل مستجيب فقرة تنطبق عليه أكثر من غيرهاء ويضاف وزن هذه الفقرة 

2 سمس لے ا متسس 

إلى درجته الكلية. 
a ۶‏ ~ 
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والدرجة الكلية تقسم فيما بعد على عدد الفقرات التي أقرها الفحوص من أجل الحصول ٠‏ 
على متوسط وزن الفقرة. ويستخدم هذا التوسط لحساب أو وصف اتجاهات الفحوصین أو 


المستجيبين. 

والصيفة الثانية الأكثر شيوعاً للاستبانات اقترحها ليكرت (1932 (Likert,‏ وتتطلب طريقته 
IG. Lbs‏ من الفقرات تبين كل منها إتجاه إيجابي أو سلبي بالفسبة للبناء الكوش وفنا لا 
مو Ele‏ يقرا الستجیب الجملة يختار استجابة على متصل 
مؤلف من خمس نقاط تتراوح بين موافق بشدة وغير موافق بشدة. وكما هو مبین على النحو 
الآتي: 

يجب أن يطيع الأطفال والديهم بدون استفسار (دون معرفة الأسباب) 


غير موافق بشدة غير موافق محاید موافق موافق بشدة 


والفقرات هنا لا يتم تد ریجها قبل تطبیقها على الستجیبین: , ولکن يستخدم الستجیب 
متصل الاجابة (5-1) ليؤشر درجة إقراره للموقف الذکور في الفقرة. ولاعطاء الدرجات على 
متصل الاستجابة التدرج dR‏ )1( للاستجابة التي تظهر آقل مستوی من التعبير 
الإنفعالي» والدرجة )2( للاستجابة التي تلیها في درجة التعبیر الانفعالي والدرجة (3) 
للاستجابة التي تلیها في الستوی أو الشدة وهكذا . وإذا افترضنا ثانية أن مطور الاختبار 
يريد اعطاء درجات أعلى للمستجیب الأقل إنفعالاً أو اکثر تساملا؛ فان الفقرات الثلاث 


المذكورة adel‏ تكون درجاتها عل gall‏ الاتي: 


۱ 1 يجب أنايطيع الالال والديهم 

| دون استفسار . ۱ 

lia یمتا ال لیم ضيط اق‎ /2 l 
E فى‎ | 


00 petel عم ال‎ A i 





Sere‏ نت ,یمین 




















شا ee‏ دنز سم ae ae‏ ما و 
۷ جرد ی E‏ ما ۴ 
oe‏ وس ae _ ge ok an y a sE be ics‏ رو NEAL.‏ کک سواه کاس 50 A‏ ا Fái‏ 36 
E‏ 5 3 2 م s EERME CE‏ 
da, ot‏ برأ عه ۳ مجح Rea‏ 1 سس f S sand Sar Ett‏ كف« م ان ارما 


n th 
الكلية شي مجموع درجات الفقرات جميعها . وفيما يأتي بعض‎ PER ا‎ 
ومراجعة فقرات استبانة ليكرت أو موافق - غير موافق:‎ GUS الإرشادات العامة التى تفيد فى‎ 
اكتب الجمل أو الفقرات في صيغة الحاضر.‎ /1 , . - 
مب 2/ لا تستخدم جمل واقعية آو تلك التي تكون قابلة للتفسير الواقعي.‎ 
ي 3/ تجنب الجمل التي تحتمل أكثر من تفسير.‎ 
غير‎ sl) تجنب الجمل التي يجيب عنها الجميع ب غالباً (أو موافق بشدة) أو نادراً‎ 4 
حاول أن تكون عدد الفقرات التي تعبر عن انفعال إيجابي مساوياً لعدد الفقرات التي‎ /5 > 
أن تكون الجمل قصيرة ولا تتجاوز 20 كلمة.‎ ۸6 ۰ 
يجب تجنب الجمل التي تتضمن كليات مثل لا شيء؛ وأبداً لأنها تعطي الغموض.‎ /8 > 
فقط دائماًء لیس‎ (fie (indefinite qualifiers) تجنب استخدام متطلبات غير محددة‎ /9 
غيرء عدید. قلیل؛ نادراً.‎ 
وتجنب‎ » AaS pa ولیست حمل معقدة أو‎ ed كلما آمکن: حاول أن تكون الفقرات بسيطة‎ / 10ra 
الجمل الشرطية التي ت تستخدم (إذا) آو (لأن).‎ 
استخدم الالفاظ التي تفهم بسهولة من قبل المستجيبين.‎ 11 
تجنب استخدام علامات النفي مثل (لاء ولا واحدة أبداً).‎ 1 
(An- ويمكن الرجوع إلى مصادر حديثة تفید في بناء فقرات مقاییس الاتجاه مثل اندرسون‎ 
(Undinsky, et.al., 1981) وبودتسكي وزملاژه‎ (Dawes, 1972) وداویس‎ derson, 1981) 





وهناك صيغة آخری شائعة في بناء الاستبانات هي استخدام أزواج الصفات القطبية. 
زویعود أصل هذه الصيغة إلى أوزجود وزملاؤه )1957 (Osgood, et.al,‏ إن اقترحوا استخدامها 
في دراسة SEY‏ اللغوية للأبنية النفسية, إذ x‏ الاعلی اسم البتاء النقسي الراد 
قياسه ويتبع بزوج من الصفات التي تمثل قطبين متعاكسين على التصل نفسه. ويفصل 
ما او bundy Al‏ ا وجه الفحوص لیضع علامة علی التصل في الکان 
الذي يعكس مشاعره. وكمثال في محاولة تقويم إتجاهات المعلمين في العمل مع الطلبة المعاقين 
عقلياً » یمکن استخدا م الصيغة الاتية: 
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- ويعد أن اختبر أوزجود وزملاژه lose‏ كبيراً من أزواج الصفات المتنوعة وجدوا أن معظمها 
يتجمع ضمن aly‏ من GLAM‏ الثلاثة الآتية: التقويم » والفعالية. والنشاط والتي تقع ضمن 
المعنى اللغوي للبناء اللفظي. وقد اقترجوا طريقة في تحليلٍ استجابات هذه الفقرات 
وتفسيرهاء واطلقوا على آداتهم هذه اسم التفاضل اللغوي کی مطور الاختبار الذي يعد 
ee‏ و تية القطب الجديية (أي درن استخدام_الأزواج المختبرة من 
قيل أن يحدد كيفية اعطاء الدرجات وتفسیرها. وهي fie‏ هذه الواقف يجب وصف الفقرات 
في قائمة صفات ثنائية القطب بدلا من مقیاس التفاضل اللغوي. 2 ' 

ومن الهم عند تطويز فقرات القیاس الانتباه إلى مجموعة الاستجابات التي AB‏ على 
سلوك المفحوصين منفردين. ويمكن تحديد مجموعة الاستجابات على أنها ميل الفحوص OF‏ 
يستجيب بطريقة معينة لصيغة معينة من الفقرات بغض النظر عن محتواها. 

وقد قدم جيلفورد )1954 (Guilford,‏ تحديداً تقليدياً لأنواع عديدة من الاستجابات المألوفة, 
وقدم مقترحات لخفض أو ضبط أثر هذه التأثيرات. ومجموعتين من الاستجابات تؤثر في 
الدرجة على المقياس هي الميل للموافقة على جملة بغض النظر عن محتواها والتفسيرات 
التفاضلية للافراد على الأشياء والتطلبات غير الحددة مثل بعض, Bale‏ 

. وهناك قضایا أخرى تتعلق ببناء الاستبانات تتضمن آثر استخدام أنواع مختلفة من النقاط 

الرابطة (anchor points)‏ على متصل الإجابة انظر )1979 (Frisbie & Branden burg,‏ و 
yf (Lam & Klockers, 1982)‏ عدد مختلف من بدائل الاستجابة (أنظر 1974 Masters,‏ 
.(Velicer & Stevenson, 1978‏ ومثل هذه الدراسات توضع أن القرارات حول كيفية قياس 


السلوك يمكن أنْ تثبّت بصورة حتمية الشيء المقيس. 5 
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لسا 


مراجعة الفقرات Item Review‏ 
عندما تعد مسودة الفقرات ينصح مطور الاختبار بأن يراجع زملائه المختصين ويشكل غير 
رسمی مراجعة الفقرات لكل من الدقة. والصياغة والقواعد» والفموض وآمور فنية آخری. 
تسا eh eal‏ الذي قيمع شاك و الي اعا I‏ د اا 
تكتب الفقرات يجب أن تخضع لمراجعة رسمية فقرة فقرة (Item by item)‏ ويجب أن يتضمن 
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3 الخلل الفني في بناء الفقرة nas e‏ حي يل pol‏ 
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7 7 a; a LE 9 الو مز‎ ۲۹ wre AR امات‎ e. الهجومية أى التحيز‎ /5 
E ~a hee SK 

i t: زر اه‎ Bai feos benii. ern 93  ةیئورقلا مستوى‎ /6 


وهذا یتطلب خبراء متنوعین في مراجعة الفقرات, فمثلاً. الخبراء في الوضوع یکونون 
الاکثر ملائمة لري ما [ذا كانت الققرات Sl‏ ومتضمنة الفاتیح الصحيحة 6(Correct-‏ 
ly Keyed)‏ موهوّلاء الخبراء هم الژهلون للحکم على ما إذا كانت الفقرات مناسبة لواصفات 
الاختيار او خصاتض laa!‏ (وتقمییلات dig) IS!‏ العملنة مين فى الفصل الخاشر Gua‏ 
موضوع صدق الحتوی). کذلك فان المختصين في القیاس ویناء الاختبارات هم الأنسب للحکم 
على ما إذا كان هنالك SUA‏ في البناء امقيس AGT‏ فمثلاً عندما تکون الفقرات من نوع 

فتجار من متعدد فإن الخبير آلقتي ينظر إلى الخلل في الصيغة کان يكون البدیل الصحیح 
أطول من البدائل الأخرى» كذلك هو الأقدر على تحديد أنماط الاستجابة التي یبدو أنها تؤثر 
في الدرجات. وهى يأخذ بعين الاعتبار ملائمة الفقرات لأنماط الاستجابة المختلفة. ومن لمهم 
توافر خبير لغوي إذ أن SI I LS SES‏ 
وأخطاء تتقيط أى استخدام جمل وعبارات غير مألوفة مما يؤدي إلى تفسير خاطيء للفقرة. من 
حية أكرى عل الخزراء حم الها إلى لافطا واللقوية: 

ومن الضروري أن يعرف واحد أو AST‏ من فريق الخيراء خصائص المجتمع الذين ستطبق 
عليهم الفقرات. من أجل أخذ الحيطة والحذر من کون الفقرات تأخذ طابع عدواني أو متحيز 
ضسد أي مجموعة فرعية من الجتمع الکلي مثل استعمال مظهر حضاري غير مالوف أو 
محتوی غير مالوف تا وان all‏ مش E EE EETA‏ 
tay‏ مناهرا (علی سبیل اال هی ما tal‏ قطان هناك el‏ البسنیط ربيف أن 
تستخدم غرضاً ملائماً الشراء من قبل معظم الفحوصین أو عائلاتهم لا استخدام غرض 
شرائه محصور بالفثة الترفة آو العائلات القتدرة فقمه. 














هدقف ee‏ قياس شيء انكر ر ماراھ القراءة. وهناك cas‏ 





== 7 















































معيارية لتقييم مقروئية مقالة مكتوية التي لا تناسب فقرات الاختبار بسبب تركيبها أو طولها» 
وهنالك طريقة واعدة لقياس المقروئية قدمها ایرونسون وزملاوؤه )1984 (Tronson, etal.,‏ . 

هذاء ويمكن القيام بمراجعة الفقرات قبل التطبيق الأولي أو cosas‏ فاختيار التسلسل 
المناسب يكون على آساس من اكلائمة والاقتصاد. فإذا توفر الخبراء الراجعون ووقتهم يسمح 
بالمراجعة:-فإن المراجعة تكون قبل التجريب الأولي: وبالتالي فإن وقت التجريب لا يضيع في 
اكتشاف الفقرات الخاطتة آو التحيزة. ومن جهة آخری تحتاج الغذيد من الفقرات مراجعة أو 
إعادة صياغة بعد التجریب. مما يؤدي إلى لزوم مراجعة إضافية للفقرات من قبل الخيراء. 
أيضاً إن كان الوصول للخبراء ثانية مكلفاً من حيث الوقت والجهد فإن العديد من معدي 
الاختبارات ومطوريها يؤجل أحكام الخبراء إلى ما بعد التجريب الأولي للفقرات وبعد 
المراجعات الستفيضة. وعتدماً تستخدم نتائج تحكيم الخبراء على أنها مؤشرات وشواهد 
لصدق المحتوى فمن المهم أن تكون المراجعة من قبل فريق المحكمين للصيغة النهائية للاختبار 
أو الفقرات. 
التجريب الأولي للفقرات: Preliminary item tryouts‏ 

من المستحسن GL‏ الاختبار قبل أن يطبع الفقرات بصيغتها النهائية تجريب الفقرات على 

dire‏ صغيرة من المفحوصين» وعندما يتوافر عدد قليل من الأفراد (كما هو الحال في البرامج 
التجريبية). فإنه يجب الاحتفاظ بمعظم الفحوصین وذلك لتجريب الفقرات ميدانياً على “ba‏ 
وفي مثل هذه الحالات من الضروري تطبیق الفقرات على عدد قلیل من الأفراد پتراوح عددهم 
بين 20-15. بينما تطبق الفقرات على عینات آکبر یتراوح Lasse‏ بين 300-200 مفحوصاء 
وذلك عندما یطوّر الاختبار للاستخدام التجاري, وعندما یکون عدد الفقرات كبيراً جداً وفترة 
التطبیق قصيرة یمکن تطبیق مجموعات من الفقرات على عینات مختلفة من المفحوصين. 
ویکون التجريب الأولي للفقرات على الاغلب غير رسمي, وعلی مطور الاختبار أن يستغل هذه 
الفرصة لیلاحظ تفاعل الفحوصین مع الفقرات وبعض سلوکاتهم مثل التوقف الطویل أو 
الخربشة أو تبدیل الإجابةء وهذه تشر تشویش في فقرات بعینها. وبعد التجريب يجب عمل 
مراجعة تستخلص منها ملاحظات حول الفقرات جمیعهاء ومن ثم تقدیم مقترحات لاجراء 
التحسینات الممكنة. 

ویوصی أيضاً بإجراء تحلیل احصائي وصفي للاستجابات على کل فقرة, وهذه تمکن 
مطور الاختبار من الحصول على فكرة سريعة Lac‏ إذا كانت الفقرات ملائمة من حيث مستوی 
الصعوية للمجموعة ککل, وما إذا كان هنالك تبايناً Lats‏ في الاستجابات من أجل تعدیل ما 
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مکثف بالاقادة من نتائج التجریب الاولي. 


The next step الخطوة التالية‎ 


تكن GN i all‏ والم :سات Shae EE‏ تكو ما مایق على 
نطاق واسع (التطبيق الميداني)» وهذا يتطلب تطبيق الفقرات بصیفتها النهائية على عينة كبيرة 
فخ ail‏ :كران الم میم E gayle N‏ كثلك دانسا نخس انس 
ا hak lea‏ من خلال طزائى ها عرف باس فل الفقرات. 

وفي الوحدة السابعة عشر من هذا الکتاپ تعرض دراسات تصمیم الاختبار اليداني 
للفقرات وإجراء التحلیل الناسب. وعندما یکون التفسیر معياري الرجع هو الهدف فان مطور 
الاختبار پستخدم نتائج التحلیل في طرح آو حذف الفقرات التي لا تؤدي الوظيفة كما يجب. 
وکا ple ties‏ من الفصل الرابم عشر إنه لا یوجد اتفاق على استخدام نتانج التحلیل في 
irr vires‏ انم irre‏ را هت لمم 

وعتدما يكم (عداد الصيغة النهاتية للاختبار, فان مطور الاختبار ملزم باٍجراء دراسات 
قات وی ERGE Ee‏ هس ضوعات اضر 
من السادس وحتی التاسم (الوحدة الثانية من الکتاب): والقترحات لتطویر طرائق التصحیح؛ 
واستخراج العاییر وتقدیم البپاتات العيارية للافادة منها في تفسیر las‏ الاختبار هي 
كوش ع l lei aaa ll‏ ۱ 





“rt Tae الاخقيان:‎ ei ene a ان ومد‎ i الامداف‎ ood 
> تطوير اختبار يمين بين الأفراد على بناء معين؛ وتطوير اختبار مصمم لإنتاج‎ sa 
٠ درجات تصف مستويات. كفاءة آکثر تجريد في مجال محتوى معين. وجطوات:‎ | ef 
۱ مهمة.في تحدید السلوکات التعلقة ببناء معين تتضمن تحلیل الحتوی ومراجعة‎ 
الأبحاث والواقف الهمة واللاحظات الباشرة والأهداف التعليمية. وفي تطویر‎ 
BUS ا الاختبارات التجضيلية المحكية فإن هدف مطور الاختبار یکون تأسیس‎ 
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التمارین: 


الاهداف فی LMA‏ جدول الواصفات التی بلیها: 
[- تفسیر خصائص توزیم clays‏ مجموعة مفحوصين من خلال مقاییس النزعة 
المركزية ومقاییس التشتت. 
Si at‏ الاحتمال التر ا مقاييس النزعة a‏ كزية, sles‏ التشتت, القيمة 
dad‏ النحنی الطبيعي, النحنی الغياري الطبيعي, الدرجة الخام. الدرجة 
ae‏ الدرجة الزائية یه dus‏ معامل الارتياط الأزواج ا مرتية, معامل الاتحدار» معادلة 
د- تحویل الدرجات الخام إلى ole pall‏ النحرفة والدرجات )42151 


و- ريط الدرجات الزائية العتمدة على النحنی الطبیعی بالساحة تحت النحنی الطبیعی 
باستخد ام الجد اول الزائية الطبيعية. ۱ 


و- تمییز الواقف التي تکون فیها الدرجات الزائية AST‏ فائدة من الدرجات الخام. 

5“ استخدام الازواح الرتبة لعمل تفسیرات حول طبيعة العلاقة بین التغیرات. 

-e‏ حساب معامل الارتباط وتفسيرها. 

ط- تفسير العلاقة بين الآزواج الرتبة وخط انحدارها. 

7 حساب قيم الیل والقاطع لخط الانحدار لبيانات واستخدامها في بناء خط 


الاتحدار: 
ك- استخدام معادلة الانحدار في حساب القيم الْتنباً بها للأفراد على متغير محكي 
بمعرفة درجنه على التنبیء. 











=== 1 











ل- استخدام الخطأ المعياري التقدير فى تكوين فترة ثقة حول قيمة درجة الحك التنباً بها . 
توزيع المعالم التوزيع الطبيعي2 الارتباط / الاتحدار 


العرفة %10 


الفهم %30 


%60 


%35 %15 %50 
2/ افترض أنك تريد بناء اختبار يغطي وحدة الاحصاء باستخدام جدول المواصفات 
السابق ولديك الوقت الكافي لبناء 30 فقرة. 
التوالى. 

-o‏ ما نسبة الفقرات التي يجب أن تغطي موضوعات مواصفات التوزيع الأساسية 
والارتباط على التوالي. 

ی الفقرات التى يجب أن تغطي موضوعات الارتباط والاتحدار في مستوى 
التطییق. 

3( راجع مواصفات الفقرة البينة في شکل )1-4( وطوّر مواصفات مشابهة للمهارة 
الفرعية «القدرة على طرح الاعداد العشرية». 

1/4( أنظر إلى المشكلة الآتية المطروحة فى اختبار فيزياء للمرحلة الثانوية «جمعت كمية 
من الغاز فوق لاء عند درجة 16 م؛ وكان ضغط خليط الفازات 982.9 تور. وسحب 
تور بخار el‏ وکان الضفط الجزئی للغاز التبفي 3 تور. فما ضفط المأء عند 
Lays‏ 16"م. |ذا آراد للعلم أن يحول هذه البسالة إلى صيغة سژال. حدد جزني 

ب) افترض أن العلم صمم هذه الفقرة بالأساس على آنها تقیس عملية التطبیق. وطبق 


























الاختيار على صفوف عدة من الطلبة الذين تقدموا للاختبار على فترات متتالية في 
بعد أن الصفوف التي تقدمت للاختبار في آخر اليوم كان آداژها أفضل من تلك التي 
تقدمت للاختبار في بداية الیوم» إلى ماذا تُعزي هذه النتيجة. 
ج) قارن بين مزایا ومساويء استخدام أسلوب الفقرة - الصيغ فى بناء الاختبار للموقف 
السايق. 
[- يجب أن تبقى الأمهات العاملات في البيت لانهنْ يأخذن الوظائف التي يحتاجها 
الرجال المسؤولون عن عائلات. 
ب- إذا أرادت الأم أن oad‏ فیجب أن يكون في الوقت الذي يكون فيه أطفالها في 
ا مدرسة. 
ج- في الولايات Breall‏ أكثر من نصق الأمهات اللواتى أطفالهن فى عمر المدرسة 
يعملن خارج البيت. 
د- ليس من الممكن للمرأة أن تجمع بين رغبتها في الحصول على وظيفة مع عدم 
تقصير ها دود ظیفتها الأساسية ais‏ دون أن تشعر L‏ لضغط. 
6 طالب دراسات عليا في ale‏ النفس التطوري مهتم في بناء استيانة لتقييم مفهوم الذات 
للأطفال. اقترح على الاقل ثلاث طرائق تفيده فى تحديد النطاق لهذا اليناء. 
7/ عالم نفس مهتم في تطوير استبانة لتقييم اتجاهات المستخدمين في المجتمع نحو 
العاملين فى مجال خدمة المعوقين حركياً. 
أ- حدد ثلاث طرائق مختلفة يمكن استخدامها فى تحديد البناء» وقارن بين مزايا 
ب“ sta‏ ثلاث صيغ لفقرات مختلفة يمكن استخدامها فى هذا الوقف واكتب فقرة 
واحدة تمثل کل Yio‏ 
8/ للمناقشة الصفية )1,3 wei . (Irvin, Halpern & Landman, 1980) Ula.‏ عن 
الأسئلة الاتية وناقش اجاباتك. 
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1~ هل تبين المؤلفون (أو أشاروا بوضوح) إلى الهدف الأساسي التي تستهدفها درجات 
الاختبار في بطارية العلومات الاجتماعية وما قبل المهنية. 

أي أساليب تطویر الاختیار الأساسية بیدو أنها إعتمدت في عملية اليتاء.- الفروق 
الفردية أن معاينة النطاق. 

جح قارن وصف المؤلفين للدراسة مع الخطوات العشرة المذكورة عن تطوير الاختبار 
في * هذا gl eae‏ من هذه ve‏ حذفت؟ حدد الأنشطة التي m‏ المؤلفون 


Tht 


سب إلى آي مدی تدعم Mees‏ الناتجة فرضية أن فقرات از اليديل وفقرات 
الصح . had..‏ وفقرات الاختيار من متعدك تقيس بناءات مختلقة. 
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درجات الا ختبار کدرجات مركية 
تعد بطاروة الاختبارات تجمیعاً لاختبارین أو أكثر صممت لتطبق على مجموعة الفحوصین 
نفسهم. وتحسب فیها درجة منفصلة لكل مفحوص على كل اختبار في البطارية. ومن الأمثة 
المشهورة لهذه الاختيارات اختيار ‘GRE‏ الذي يمكن بوساطته الحصول على در ت منفصلة 
على اختبارات لفظية, وکمية. وتحليلية لكل مفحوهت. (والدرجة المركبة هي الدرجة الناتجة عن 


" جمع درجات اختبارين فرعيين أو أكثرء وللتفسير الصحیح للدرجات المركبة من المهم فهم 


كيفية تاثير خصائض درجات الاختبارات الفرعية احصائياً على الدرجة المركبة. والأكثر 
أهمية من ذلك هو أن يميز باني الاختبار ومطوره أن درجة كل اختبار تعد درجة مركبة؛ ويمكن 
تحديد درجة الفقرة على أنها عدد النقاط اتُعطاة لاستجابة الفحوص على فقرة معينة. وعند 
إعطاء درجات الاختبار فإن درجة الاختبار الكلية تحدد Sule‏ بجمع درجات الفقرات جميعها . 


وكام فإنه يمكن اعتبار كل فقرة في الاختبار على أنها اختبار فرعي قصير. ويمكن اعتبار 
“ل درجات الفقرات على آنها درجات اختبارات قصيرة (درجات اختبار صغرى). ومن هذا 


المنطلق فما أن يتم حساب درجة الاختبار بجمع درجات فقراته فإن الدرجة الكلية للاختبار 
تعد درجة مركبة. 

وشنيطوج هذا الفصل الإجراءات الاحصائية الممكنة لدرجات الفقرة وعلاقة خصائصها 
بدرجة الاختبار الكلية. إن الشيء الأساسي والمهم في عملية تطوير الاختبار هو الفهم بأن هذه 
الفقرات تؤلف الوحدات البنائية للاختبار. ولا يكون للاختبار ككل خاصية غير تلك 
الخصائص الوظيفية لفقرات الاختبار. ولكل من ينشد بناء اختبار جيد يجب أن تتوافر لديه 
معلومات حول توزیع درجات الفقرات وعلاقة كل فقرة بالفقرات الأخرى المؤلفة للاختبار. 

وقد بحثنا في الفصل الثاني LAS‏ تطبیق مفاهیم الوسط والتباین والانحراف العياري في 
وصف درجات الاختيار. وسنعرض الآن كيفية تطبيق هذه الاحصائیات على درجات الفقرات 
ومن ثم كيفية تأثيرها على توزيع خصائص الدرجة الكلية. 


مخططات تصحيح الفقرة 
| _يمكن تصنيف فقرات الاختبار على انا ثنائية التفرع أو متعددة التفرع. وتعد الفقرة ثنائية 
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التفرع إذا كانت القیم الوحيدة المكنة للدرجة إما صفراً (إجابة خاطئة) أو واحداً (إجابة 
صحيحة). وفیما Sts‏ أمثلة لفقرات ثنائية التفرع. 0 

1- تسمی المسافة بين نهایات LAAI‏ العصبية: 
آ- شچیرات عصبية بت محور عصبي 

ج نقطة التشايك د“ نیوترون 

2~ دجب أن یکون للمعلمين في المدارس الحق في الاضرات: 

~ موافق ب- غير موافق 

ففي الفقرة الاولی تعطی الاجابات i)‏ ب» ج) الدرجة صفر والاجابة (ج) الدرجة (1). 
وفي الفقرة الثانية تعطی الاجابة (1: موافق). الدرجة )1( والاجابة (ب: غير موافق) الدرجة 
صفر. 
وكما رأينا في المثالين السابقين فإن الفقرات ثنائية التفرع قد تظهر في مقاييس كلا 
جالين المعرفي والوجداني, فقد تكون ذات بدائل متعددة كما في المثال الأول, وقد تكون ذات 
¿ كما في المثال الثاني بما أن التصحيح يعطي الدرجة صفر أو واحد فقط. آما مخططات 
غير الثنائية فان مدى الدرجات الممكنة يكون غير مقيد بواحد أو صفر. وكامظلة 











isl /1‏ جملة صصیحه قواعدیاً باللفة LU‏ مستكدما المديفة الفردة الفعل 
Verstehen‏ (أعلى درجة للفقرة 3 ويمكن إعطاء أي جزء منها). 

2 يعد الشخص التخلف عقلياً غير منتج في الجتمع: 

أ- موافق بشدة ب- موافق ج- لا رأي لي 

د- غير موافق ه- غير موافق بشدة. 

(وتتدرج درجات الفقرة من 1 إلى 5 مع أعلى درجة للإتجاه الايجابي للسواطنين نحو 
الأنراد المتخلفين عقلياً). 

وکما شو مس في «JHI‏ فإن الفقرات المقالية أو ols‏ الإجاية القصيرة تصحح على الأغلب 
باستخدام مخططات غير AGUS‏ التفرع. وکذلك فقرات معظم مقاییس الاتجاهات أو الأداء فانها 




















دب ود وو سم وس 


Ce لار سط وکا‎ SAE fey wey poe) oy اكرات كر شا‎ 


رسا C‏ رماس NSH‏ رسو راط ول وص کور 
انر میرم لچریہ حو 15 ان Diy‏ حا مات CAFAS‏ 


الاحصاء الوصفی للدرجات غير ثنائية التفرع 
bair‏ رر اط ( و èa p‏ العم 


رسو ۸ 


one‏ الجدول )1-5( استجابات )10( مفحوصین على )5( فقرات في مقیاس اتجاهات تم 
تصحیحه على تدریج يمتد من «أوافق بشدة» إلى «لا آوافق بشدة». وتتراوح القیم الممكنة 
لدرجات کل فقرة (من 1 إلى 5): ویطلق على مثل هذا الشکل اسم مصفوفةالفرد- الفقرة. 
ویتضمن كل صف في الصفوفة استجابات الفرد على فقرات الاختبار جميعهاء ویتضمن كل 
عمود استجایات الأفراد جمیعاً على فقرة بعینها. 


جدول: (1-5): استحاسات 0 افراد على 5 فقرات في مقیاس انحاهات صححت على تدریج من 1 إلى 5: 





وفي هذه الصفوفة يشار إلى موقع JS‏ عنصر برمز كبير بذیله رمزین فرعيين (Xie)‏ إذ 
يمثل الرمز الفرعي الأول )1( قيمة الصف ویمثل الرمز الفرعي الثاني قيمة العمود . ومکذا 
فان (Xip‏ شیر إلى الدرجة في الصف الأول في العمود الأول أى استجابة الفرد الأول على 
الفقرة الأولى. وفي الجدول أعلاه فإن قيمة (X1)‏ تساوي (5). وأما الرمز X23)‏ فإنه يشير 
إلى قيمة الصف الثاني في العمود Lill‏ أو استجابة الفرد الثاني على الفقرة الثالثة 
وتساوي (3). وان كان معد الاختبار مهتماً بتحديد قوة الاتجاه لفقرة معينة فما عليه إلا أن 




















العادلة (1-2), وکما یاتی: 
2X;‏ 


NoT 


10/2+54+4+14145+2+44445 = 
= 


وإن كان یرید معرفة مدی تباین استجايات الأفراد على فقرة. فإن تباین الفقرة يحسب 
بتطییق العادلة )4.2( وعلی النحو الآتي للفقرة الاولی: 


KD) وى‎ 

No 1 

© = )5 - 263.1 + )2 - 3.1 )^+ 000 + )2- 23.1 /10 
د 


وقد يهتم معد الاختبار أيضاً بمعرفة ما إذا كان هنالك علاقة بين درجات الأفراد على 
الفقرتين )2,1( وهذه تحسب باستخدام المعادلة )13-2( والتي تبين كيفية حساب معامل 
الارتباط. ويبين الجدول (2-5) مصفوفة معاملات الارتباط لكل زوج من الفقرات الخمس 
المذكورة في الجدول (1-5): 


حدول (2-5): مصفوفة الارتباط الداخلدة لدرجات الفقرات المدونة في جدول (1-5): 





ویتضع لنا من الجدول آن الفقرات )4,3,2,1( تشر آنماط استجابة متشابهة, بینما 
الفقرة )5( ترتبط بالفقرة )4( ولکن الاداء على هذه الفقرة له علاقة ضعيفة بالاداء على 
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الفقرتين (3,2). وسنناقش في الأجزاء التالية كيف أن مغلومات مثل هذه تفيدنا في بناء 


الاختباد وكيم ور را ننم fot eat‏ 0 
مانت كمد د يفلد الداع pill‏ العا ری 
الإحصاء الوصفي للفقرات 4.403 الدرحة: SG or sas det}‏ و 57 tg:‏ م 
ی اشک سد 7 (lee‏ ا E‏ کش iad‏ 
10 ۰ يمنا رات اور مه 2 از وس یت y‏ 
سايق انفع "م مه ج الوط د لالت 2 


re وضعل‎ Eon التفرع فإنه يمكن‎ a an TT 
ب اصعوية‎ ra وتباينها وانحرافها المعياري. ولاشتقاق هذه الصيغ سنستخدم مفهوم‎ 
الفقرة» والتى تعرف بأنها نسبة الأفراد الذين أجابوا على الفقرة إجابة صحيحة. وعلينا‎ 
ملاحظة أن هذا الصطلح تقتي ويبدو متناقضاً ومثيراً الجدول عند استخدامه من قبل الأفراد‎ 
العاديت. ووفقاً لتعريف صعوية الفقرة فان الفقرة التي أجاب علیها (685). من آفراد العينة‎ 
لها) تساوی (85.)» بینما ما الفقرة التي اجاب علیها‎ P إجابة صحيحة فان صعویتها (أو قيمة‎ 


ORAS‏ مل 






iar ام جم معدو‎ araea 


)50( من أفراد العينة إجابة صحيحة فان صعویتها تساوي )50( 5 آي بنسية متعوية أقل. 
وهکذا فان الفقرة الأسهل يكون معامل صعویتها آعلی. ويبين الجدول )3-5( مصفوفة الفرد- 
الفقرة التي تمثل كل عنصر فیها درجه 3 الفرد (i)‏ على الفقرة (ز). وفي أسفل الجدول معامل 
صعوية كل فقرة. وا ن ها ae‏ 

suc‏ الأقراد الذين حصلوا على درجة على الفقرة 


صعوية الفقرة = 
98 عدد آفراد العينة 





ai‏ لت 
N H‏ 





وحیث أن قيم (x)‏ اما )1 gi‏ صفر) فان [26 

تكافىء عدد الأقراد الذين حصلوا على الدرجة (1) على الفقرة. 
وهکذا فإن: ۱ 

)1-5( Pj = pj 


94 











جدول (3-5): استجايات 10 مفحوصين على )5( فقرات صححت تناکیا: 





Kj)” 2 
od اکا‎ oy 


2-5 L A 


وللفقرات ذنائية التصحيح» فإن الصيفة الأيسط لحساب تباین الفقرة هى: 


3 Pj qj = OF 


حيث أ ب ¶ = (LPI)‏ ويمكن عرض أسلوب جبري بسيط لإثبات الصيغة )3-5( لتبيان 
أن الصيغة (3-5) مشتقة مباشرة من الصيغة (2-5). إذ يمكن فك القوس في المعادلة (2-5) 





۲ الآثى:‎ gaili على‎ 
ANE 28 SW... DU? 
4-5 N N N =o? 


ولأن Xij‏ تساوي Ll‏ )1 أو صفراً) فإن: 
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2 
2 Xj _ 2 3 
N N 

وهذه تساوي ز > كذلك فان زا هي قيمة ثابتة لقيم Xij‏ جميعهاء فان الحد الثاني في 
العادلة یمکن کتابته على النحو الآتي: 

2 د Xij uj‏ ر22- 

م 2 ہے =- کس 

N e ل‎ 





ARA) ar ی‎ 

كذلك فإن الحد الاخیر في العادلة (4-5): ك له قيمة 

ثابتة Lad‏ مضاعفة بعدد من المرات = N‏ ومقسومة على العدد N‏ نفسه. كذلك فإن هذا 
الحد يساوي 2زدا أو ۳2 والآن يمكننا إعادة LES‏ معادلة تباين الفقرة على النحى الآتي: 


2 5 2 2 3 7 
P? = o‏ + 2۳2 - بم ۱ 25 
ويجمع الحدود المتشابهة تصیح المعادلة: 
2 5 2 ۳ 
P, P, O;‏ 
وبإخراج العامل المشترك (Pj)‏ تصبع المعادلة: 
D2. 2‏ = 
o;‏ رو P, (1 -P,) = P,‏ 


وهكذاء فعندما تكون الفقرة ثنائية الدرجة فإنه يمكن حساب تباينها باستخدام المعادلة 
)3-5( وعند استخدام هذه العادلة في حساب تباين الفقرة (1) في جدول (3-5) فإن: 
5x5 =u?‏ = 025 | 


a. eae 
معامل الارتباط:‎ 
فان هنالك‎ KD عندما يكون معد الاختبار مهتماً بالعلاقة بين الإجابات على فقرتين مثل‎ 
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Pik - P; Py 
6-5 سيت‎ = Pd 
Pig - Pk qk 
مباشرة من معادلة حساب معامل ارتباط بیرسون. ولتبین‎ Wade (6-5 وهذه العادلة (معادلة‎ 
كيفية استخدام المعادلة أعلاه يبين جدول (4-5) نسبة الطلبة لكل نمط استجابة عل الفقرتين‎ 
إذ تؤشر العلامة (+) إلى الاستجابة الصحيحة والإشارة (-) إلى الاستجابة الخاطئة‎ (kj) 





على الفقرة. 
جدول (4-5): توزيع النسب المشتركة لأنماط الاستجابة على الفقرتين kof)‏ 
الفقرة (1) 
= 0.30 040 
الفقرة (Y)‏ 
l‏ 3 
0.50 0.50 
Gaa 5‏ _ 


شكل (1-5): الصيغة العامة للجدول رباعي الخلايا الممثل لنسب الاستجابات المشتركة للتوزيعات 
التكرارية على الفقرتين i‏ ). 


== 3 









































وتمثل الخلية العليا إلى اليمين نسبة الطلبة الذين أجابوا على الفقرة (1) إجابة صحيحة 
zij‏ الفقرة )2( إجابة خاطتة. وأما القيمة في الخلية العليا إلى اليسار فتمثل نسبة الطلبة 
cul‏ اخطاوافي ال(جابة على CAA AS‏ .. وهگذا. Shine sing‏ معامل ارتباط فاي 
تين )2,1( باستخدام العادلة )6-5( نصل إلى: 


041 





0.6 x 0.5 - 4 
=P )0( 


0.4 x 0.6 x 0.5 x 0.5 ۱ 


ومن المکن آیضاً حساب قيمة معامل فاي باستخدام ol LS‏ الاستجاپات. ويبين الشکل 
(1-5) تکرارات أنماط الاستجابة لزوج من الفقرات» إذ یمثل کل حرف في الخلایا عدد الافراد 
الذين أجابوا على الفقرتین وفق نمط الاستجابة المشار إليه في الخلية. فعلی سبیل الثال يبين 
العدد في الخلية )2( عدد الطلبة الذين آجابوا على كلا الفقرتین إجابة صحيحة. ویعد الجدول 
(5-5) رياعي الخلايا لبيانات جدول )3-5( وللفقرتین )2,1( . وپاستخد ام هذه GL‏ بحسب 
معامل فاي للفقرتین على النحو الاتي: ۱ 


be - ad 


(a+b) (b+d) (C+d) (a+c) 1 


1 


0.41 P (Ø) 





2x1 -4x3 
0.41 = = P (Ø) ` 


(3 + 2) (2+4) (4+1) (3+1) 35 





وهكذا فان درجة العلاقة بين فقرتين ثنائيتي الدرجة يتم حسابها باستخدام العادلة (6-5) 
وبیانات صعوية الفقرات» أى باستخدام المعادلة )7-5( وييانات التوزيع التكراري للاستجابات 
بأنماطها الأريعة. وعند استخدام معادلة صيغة التكرارات على القاريء أن يتنبه إلى أن 
التوزيع التكراري مشابة لما هو مبين في الجدول, وان كانت الفئات مرتبة بشكل آخر فان 
النتائج لا تکون صحيحة. ۱ 











جدول (5-5): توزيع أنماط الاستجابة الشترك للفقرتين (1, 2) من جدول )3-5( 


+ الفقرة (1) _ 





تباين المركب: 


بما أن معظم الاختبارات تصحح بحساب درجات الفقرات وجمعهاء ويتبع هذا أن توجد 
علاقة oy‏ تباینات الققرات النفردة وتباین درجات الاختبار SSS‏ ویوجد في اسفل مصفوقة 
الفرد- الفقرة في جدول )3-5( «التضمن استجابات )10( مفحوصین على اختبار مؤلف من 
(5) فقرات» خلاصةاحصائية متوسط وتباین کل فقرة» وعند حساب مجموع تباین الفقرات 
النفردة نجد آنها تساوي (1.10), ومن الدهش أن هذه القيمة اقل بکثیر من تباین الاختبار 
الكلي )0 = 1.64). فكيف نفسر هذه الفجرة؟ ومن الواضح أن تباين الاختبار الكلئ لم 
تیش اتات الققرات التقررة: ۱ 

ولفهم سبب تجاوز تباين الاختبار الكلي لمجموع تباین فقراته منفردة. فمن الضروري فهم 
الصيغة العامة لتباين الدرجة الكلية (المركبة). لنفترض أن لدینا درجات الفقرتین (X29 X1)‏ 
والفحوصین نفسهم» من آلمکن حساپ مجموع درجات الفقرتین لكل مفحوص, ولنرمز لهما 





C بالرمز‎ 

8-5 ۱ Xa + XI = C 

ومتوسط الدّرجة المركبة للفقرتين هو : 

9-5 2 + pl = U2 

ويمكن تحديد وسط المركب لهاتين الدرجتين من خلال الدرجات المنحرفةء وعلى النحق 
الآتي: 

10-5 X2 + Xi=C 

KER SE 
7 ی‎ =O 
11-5 . N N c 
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ويمكن كتابة هذه الصيغة على شكل حدود من خلال تحليلهاء وعلى النحى الآتي: 


12-5 22X; X, ۲ > X,’ 5 > xX _ X+ ی‎ ۳ 
N N N N 


ومن خلال التعريفء فان الحدين الأول والثاني في المعادلة (12-5)» هما تباين الفقرتين» 


YX," yx)? ١ 
2 a, l مت‎ 2 
N 2x l 








ويمكن إعادة كتابة الحد الثالث في المعادلة )12-5( وعلى النحى الآتي: 


O1 O2 25X; X, _ 22, X, ۳ 
2 اک ا‎ S 
O1 02 


ويإعادة ترتيب الحدود يمكننا كتاية: 


22X; X3 5‏ 8 2212 رو ره 
N N‏ 
2۶ _ عبارة عن معامل الارتباط 012 يمكننا كتابة هذه الصيغة 


وحيث أن الحد 
Noio2‏ 


ي اللو الات 


2X, X 
13-5 2P 190107 = 22X, X 
N 
ولأي زوج من المتغيرات‎ -Xa و‎ Xy ويطلق على الحد 0107 12م اسم التباين المشترك بين‎ 
هر معامل ارتباط المتغيرين مضروياً بانحرافها‎ SES في العينة نفسهلافان التباين‎ 
المعياري. لنفترض الآن آننا أضفنا حداً ثالثاً للدرجة المركية ٤ء فإنها تصبح:‎ 
۱ وكا + یک‎ +X, = C 






ووسط الدرجة المركبة المؤلفة من ثلاث فقرات یکون 


U + U = Uy‏ + یل 
وتكون صيغة التباين للدرجة المركبة المؤلفة من ثلاث فقرات على النحو الاتي: 
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14-5 O *+ جه ره‎ 0 2+ 20,0, O + 2p,40, OF + و0 و©ووم2‎ =O 


1 

وبالاستدلال نصل إلى استنتاج بأنه يكون هنالك حدوداً لتباین کل فقرة وضعف التیاین 

المشترك بين کل فقرتین» وعلی هذا فان الصيغة العامة لتباين الدرجة GUSH‏ الناتجة عن. 
مجموع clays‏ فقرأت عدة تکون: 


14-5 o+ Oy +... on? + 2049 0 وه‎ + 2۳ 3 =O", 
15:25 J + 2 19j 0 j 50, 


E E EAA ها‎ 1 lool الان معن‎ sal مكدع‎ TEE 
لذا فإن التباين الكلي (تباين الدرجة الكلية) يحدد من خلال فقرات‎ LSA المكونة للدرجة‎ 
الاختبار والتباین الشترك بين اذواج الفقرات الحتملة جمیعها.‎ 

إن أنسب طريقة لتصوّر عناصر التباین والتباین الشترك التي قساهم في تباين الدرجة 
الكلية من خلال مصفوفة التباین- التباین الشترك. وللاختبار المؤلف من فقرات n lasie‏ فإن 
عناصر الصفوفة يساوي (n xn)‏ وتقع تباين الفقرات على قطر الربع. بینما تقع عناصر 
التباین المشترك على أحد جوانب القطرء إذ أن القيمة في الصف G)‏ والعمود (ز) تمثل التباین 
المشترك بين ين الفقرتين Gi)‏ (أنظر شكل (2-5)). ويمثل الرمز );0( صيغة مختصرة للتعبير 
الاکثر تعقيداً للتباين المشترك (Pi 0 O)‏ ويجب ملاحظة تماثل عناصر المصفوفة على 
جانبي قطر المصفوفة:؛ بمعنی أن ۳ ال HUNG) ag ally‏ ال cgi‏ 
الصف G)‏ والعمود G)‏ (أو إن (Ojj =O;‏ 


> 
O, 62 O43 O14 TT cn 
6 2 O 0 San 

2 23 24 eeen 2 
oO 2 O Onn 

3 g4 ce 3 


شكل (2-5): الصدفة العامة لمصفوفة التباین- التباین المشترك 
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لذلك فإننا نرى فى المصفوفة فقط العناصر على أحد جانبى القطر وهكذاء فان العبارة 
الجبرية 2p; o; o;‏ تمثل (Pj Oj O; + Pij O; G;)‏ ويمكن من الشكل استنتاج أن عدد 
عناصر تباین الدرجة المركبة هو n‏ في حين أن عدد عناصر التباين المشترك هو n(n-1))‏ 
فللاختبار المؤلف من خمس فقرات فان المصفوفة تتألف من خمسة حدود للتباین وضعف هذا 


(10 _ 5 





العدد لحدود التباين المشترك ) 


لنتفحص الآن جدول )6-5( الذي يتضمن مصفوفة التباين- التباين المشترك للاختبار 


المؤلف من الفقرات الخمس المبينة في جدول )3-5( السابق. إن فحص هذه القيم ومجموعها 
وكما هو مبين فى الجدول أدناه يتبين لنا أن تباين الدرجات الكلي الساوي (1.60) هو 
مجموع تباينات ol fall‏ وتبايتاتها المشتركة. i‏ 

فا ومن خلال فحص الصيغة العامة لمصفوفة التباین- التباين المشترك نجد أنه عند 
زيادة عدد فقرات الاختبار فان عدد حدود التباین الشترك تزداد بشکل کت شا عدد حدود 
تباین الفقرات. فعلی سبيل JON‏ فعند اضافة )5( فقرات للاختبار المؤلف من (5) ققرات فان 
عرد حدود التباين يزداد من (5 إلى 10( حدود. في حين أن عدد حدود التباين الشترك يزداد 
من (10 إلى 45)/ وفي بناء الاختبار فإن هذا له تطبيقات مهمة سيتم عرضها في الجزء 
الآتى: 


جدول (6-5): مصفوفة للتباین- التباين المشترك للفقرات ثنائية الدرجة البنية في جدول (3-5) 

















1.10 -8 2 


0.54 = 2(0.27) = 22: <J Pij 0 O; 
۱ Z 0 تضمينات عملية في بناء الاختبار‎ 

افترض أن Bab‏ أعد صيغة تجريبية لمقياس قلق الاختبار والإجابة على فقراته إما أوافق 
أو لا آوافق, لذا فإن الاختبار يعد ثنائي الدرجة. ولهذا فإن مطور الاختبار عليه أن يفترض 
قلق الامتحان بناءٌ نفسیاً وستکون الفروق الفردية مهمة عند تصميم الاختبار. وهذا يؤدي إلى 
تباین أساسي في درجات الاختبار. وبعد الحاولة الأولية لصيغة قصيرة من الاختبار (علی 
سييل الثال 0 فقرد) یجد. الباحث أن التباین لیس كبيراً كما هو متوقع. ویتساءل الباحث عن 
كيفية تعديل الاختيار لزيادة التباین» ويأخذ بعين الاعتبار العوامل التي تو تؤثر في تباین 
الدرجة‌الكلية. فكيف يمكن هذا؟ 


1) هل يزداد تباين الاختبار إذا ازداد عدد فقراته؟ إن إضافة فقرات إلى الاختبار فى 
eh‏ ارا ارا ل سس سس : 
أغلب الحالات يزيد التباين بقيمة تساوي تباين الفقرات ومجموع تبايناتها المشتركة مع 
a‏ الأخرى oS‏ ای E‏ اه تباین ا الكلي 
آضیفت إلى الاختبار الطویل. ویمکن ملاحظة ذلك في الحالات الآتية: لنفترض إضافة 
)5( فقرات على اختبار مؤلف من )20( فقرة متوسط تباین فقراته (20.) ومتوسط 
تباینها المشترك )10( وتباین الاختبار الكلي )42( فعند إضافة )5( فقرات إليه لها - 
متوسط التباین والتباین الشترك نفسه فان تباین الاختبار الجدید یصبح: 

65 < (.10)(24)25 + )20(25 = o% 

والزيادة من )44( إلى (65.) هی زيادة فى تباين الاختبار الكلى وبما نسبته )9055( 
ومثال آخر لاختبار مؤلف من (70) فقرة بمتوسط تباين (0.2) لفقراته وتباين مشترك 
)0.10( وبتباین كلي للاختبار )497( وعند إضافة )5( فقرات أخرى للاختبار لها التباين 

570 = )10( 04 05 + (.20)75 = o% 

والزيادة في التباين من )497( إلى )570( تمثل نسبة زيادة )%15( فقط من التباين 
الكلي. وعندما Afa‏ بعين الاعتبار تكاليف بناء وتطبيق الاختبار نصل إلى نقطة تكون عندها 
الزيادة الإضافية في تباین الاختبار الكلي غير متكافئة النفقات الإضافية في المال والجهد 
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والوقت اللازمين. ويجب الإنتباه أيضاً إلى ارتباط الفقرات السلبي مع بعضها البعض لسبب 
eT‏ و م E‏ و 
ما فإن مثل هذه الفقرات ستقلل من تباين الاختبار الكلي بدلاً من زيادته. 
۱3۳ ت 
2) ما الخليط الأمثل اصعوية الفقرات التي تزید تباين الاختبار إلى أقصى قدر ممكن؟ 












يضمن هذ ١‏ ال وال Ga‏ از هل الأفضل إعداد فقرات متساوية في صعويتها 
تکوم أكبر عندما يكون ارتباط الفقرات آکبر» ومنطقياً تظهر الارتباطات الأكبر بين 
الفقرات عندما يجيب الأشخاص أنفسهم إجابة صحيحة على الفقرتين ذو ل آو عندما 


تكون استجاباتهم خاطئة علي كلا الفقرتین, وهنا تكون صعوبات الفقرات متساوية. 


Pa,‏ رقة للعلاقة الرياضية بين معاملات ارتباط الفقرات وتساوي صعوياتها 
قدمه جوليكسن )1945 (Gulliksen,‏ على شكل تمثيل بياني كالذي موضح في شكل (3-5). 
ويتبين من هذا الشكل أنه بزيادة الفجوة بين صعوبات الفقرتين (h K)‏ فإن أقصى معامل 
ارتباط (بیرسون أو فاي) بين الفقرتين سينخفض Bas‏ وكذلك يمكن تحقيق أقصى ارتباط 
)1.0( فقط عند تساوي صعویات الفقرتین. 

والثاني: ذكر جولیکسن Lad‏ أن زيادة تباين الاختبار لا يكون فقط عند تساوي صعوبات 
فقرات, وانما يجب أن تکون متوسطة الصعوبة. ویبدو أن هذا سهل عندما نحسب تباین 
الفقرات من خلال قيم معاملات الضعوية الآتية: )20 , 40 , 50. , 70. , 90.). ومن الواضح 
أن زيادة صعوية الققرة من أدنى قيمة (20.) إلى القيمة المتوسطة )50( يزيد تباین الفقرة من 
)16.( إلى (25). ویعدها عند زيادة صعوبة الفقرة من (50.) إلى (90.) يبدا تباين الفقرة 
بالانخفاض من (25) إلى (09.)» وهکذا فان تباینات الفقرة وانحرافاتها العيارية (والساهمة 
1 فقرات متوسطة الصعوبة. ويجب التنبه إلى أن 

الاختيار من متعدد أو الصح والخطأ الذي يظهر فيها 
i‏ ن فمن الضروري على من (50.). وتحديد القيمة الأمثل 
لصعوية هذه الفقرة ستناقش بالتفصیل في الفصل الرابع عشر. ۱ 
3( هل يجب أن تكون الفقرات الضافة للاختبار مشابهة للفقرات الأصلية من حيث 

STE ۱‏ بجي أن تغطي محتوى جديد؟ إن تطوير الآختبار يتطلب إعداد سلسلة 

من الفقرات LAY!‏ تخطي الأهداف أو مواصفات مجال محدد جيداً. ويمكن للقاريء 
تمییز أنه عند إضافة فقرات للاختبار فمن الأفضل إضافة فقرات سترتبط پدرجة أكبر 
شستركة إلى 




















ERU 




















آقصی قدر ممكن. ومع ذلك فان ترجمة هذا المبدا في GES‏ الفقرات قد يكون صعباً 
أحياناً. وفي محاولة تطوير فقرات جديدة للمحتوى نفسه فقد يتحفز معد الاختبار 
لنوسيع نطاق اتحتوى التي وفطي الاختبار على أمل زيادة التباين الكلي آکثر من 
رلته آعداد فقرات إضافية اعتماداً على المحتوى الأصلى فقط. والتطبيق الأول غير 
مرغوب به نوعاً ماء لآن هكذا فقرات إضافية قد تقلل من فائدة الاختبار لأنها تغير 
نطاق المحتوى الآصليء ولان معد الاختبار يخاطر بإنتاج فقرات غير مرتبطة بدرجة 
الت صلية (وهذا يساهم قليلاً في تباين الدرجة الكلية (lat‏ وهكذا 
أهداف ينصح بإضافة فقرات على المحتوى نفسه فيما لو كانت الإضافة تهدف إلى 
زيادة تباين الدرجة الكلية. ~~ 

و ق 












Pk 





شكل (3-5): 


تجمعات معاملات ارتباط الفقرتين (Pk , Ph)‏ التي لها آقصی ارتباط (1.0, 7 , 5. ,0.00,.1) ٠‏ 

LG‏ تباين الاختبار بحد ذاته مؤشراً على نوعية الاختبار؟ حتى الاختبارات التي 
تقيس الفروق Apa pall‏ وتكون فيها هذه الفروق مهمة وأساسية فان زيادة تباين الدرجة 
الكلية هو ليس الاعتبار الوحيد الذي يؤخذ بعين الاعتبار عند بناء الاختبار. وعند 
مقارنة اختبارين مصممين لخدمة الهدف نفسه فإن مستخدمي الاختيارات سيختاروا 
الاختبار الذي تكون درجاته لها صدق وثبات أعلى (وهذا ما ستركز عليه الوحدتان 
التاليتان)» وكما سنرى فان هاتين الميزتين مهمتان fag‏ لدرجات الاختبار وتعتمدان على 
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سس چیه و 





به تب يت 








قد 


تباين الدرجات. وهكذا فللاختبارات المعيارية فإن التباين ضروري لكنه ليس شرطاً 
کافیاً لضان فائدة الاختبار. بالقابل فعندما يكون وصف المفحوصين في مجال ما هو 
- هدف القياس LS)‏ فى الاختبارات المحكية) فإن بناء اختبار أى اختيار فقراته التي تزيد 
من تباين الدرجة الكلية Ze ya,‏ الفقرة say‏ اعتباراً غير ملائم(انظر على سبیل الثال 


(Popham & Husek, 1969) «Popham, 1974) 














1/ حصل خمسة تلاميذ على الدرجات المبينة أدناه في BIG‏ أسئلة مقالية: 


آن 9 
بيل 3 
کارول 8 
ديفيد 7 
ایرین 6 


7 


Oo لہ‎ A 
A HN OW © 


أ- احسب لا ون ز لكل فقرة. 


شب ما وسط درجات بیل. 


ga‏ ما وسط درجات السؤال الثالث. 
د- حدد تنوع الاستجابات التي مثلتها المجموعة d‏ السژال التول. 


هت ما LEARAREN‏ 
2/ كانت درجات (10) طلاب على اختبار رياضيات مؤلف من (5) فقرات على النحو الآتي: 





ن (2,1)؟ وعلی ماذا تدل هذه عن العلاقة بين الفقرتين؟ 
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) أي الفقرات لها أعلى معامل صعویة؟ وبماذا يخبرك عن الفقرة؟ 

ب) أي الفقرات لها أكبر تباين. 

ج ما قيمة الانحراف المعياري للفقرة (3). 

د) ما معامل الارتباط بين الفقرتين (5,4)؟ 

مب آعد جدول يبين بيانات الاستجابة على الفقرتين (2 و 3( وباستخدام هذا الجدول 
احسب معامل الارتباط بين هاتين الفقرتين. 

و) ما التباين المشترك بين الفقرتين (2 و 3)؟ 

3) تم الحصول على التباينات LAW‏ لبطارية مؤلفة من ثلاثة اختبارات فرعية: 


5 2 
9 = O, 
A 1 
25 = Oo", 
۳ 2 
16 = O, 


إضافة إلى أن الارتباط بين الاختبارين الأول والثاني = 81. » والأول والشالث = 64. », 
والثانى والثالث = 90.. 

(i‏ أعد مصفوفة التباین - التباين المشترك. 

ب) حدد تباين الاختبار المركب. 

4 آراد باحثان تطوير اختبار مؤلف من (10) فقرات لقياس دافعية الإنجاز. وكانت فقراته 
فقرات متوسطاة الصنعوية والتی ارتباطها عالي. لذا قرر هژلاء تحدید فقرة واحدة لها 
asl‏ تجابات يجب أن یکون ارتباطها تاماً. فهل يعد هذا آسلوب منطقي في بناء 
الاختبار؟ وما النتائج الترتبة على هذا. 

5/ برهن جبرياً على أن Pik‏ (معامل ارتباط بیرسون) بين التغیرین (1, (K‏ هو معامل فاي 
وذلك عندما تکون قیم (K, i)‏ محددة فقط بالقیم صفر وواحد. ۱ 
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ALLIS الوحدة‎ 
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الفصل السادس 
و اه الحقيقية التقليدي 
الاختبار على اراد تفسهم في ظروف مشابهة. ویطلق على هذا تست في درجات 


علي سما 


زل ا فان الاختبارات النفسية eee‏ غير ثابتة. فمثلاً )513 تقدم م موه 0 
استعداد. ثم ارتاح هؤلاء مدة آسبوعین. فمن غير الممكن أن يحصل هؤلاء الأفراد على الدرجة 
نفسها في التطبيق أو أن یحتفظوا بالترتيب نفسه ضمن الجموعة. وبطريقة مشابهة, إذا تقدم 
با القن Wei‏ اسلا لاز في الصا ف البو كس Set‏ 
يحصل هؤلاء الأفراد على الترتيب نفسه في الاختبارين. إن مدى عدم ثيات مجموعة 
الملاحظات أو الاختبارات هي محط اهتمام كل من مطور الاختبار ومستخدميه. 


ما الذي یجعل درجات الاختبار غير ثابتة؟ عندما يجيب الفحوص على مجموعة فقرات 
اختبارية فان درجته تمثل LB‏ عينة محددة .من السلوك- وهي استجابات على مجموعة فرعية 

اتف ات الم سمخ محال معن era‏ خر في واحد من الواقف المکنة. لذا 
فان الدرجات التي تمصل عليها تحت الظروف الاختدارية Ba‏ 





ere 


القراءة للأطفال عند فر نا الطفل F‏ ا ا ا إلى 
صوت الحرف الاول فی الكلمة. من الحتمل أن پسمم الطفل "bet?‏ عندما يقرا الفاحص LE‏ 
۳ عندها شیر الطفل إلى استجابة خاطتة. وعند اعادة الاختبار من Sal‏ أن یکرر 
AES)‏ انا تشه وا کی مرها الدلفل متشه ونا هداق عدن المواقف الختلفة. ویمکن 
توضيح الأخطاء المنتظمة للقياس باستتجابة غير موافق من قبل يب على مقبیاس 
اتجاهات عندما يقابل فقرة غامضة. ولأن مثل هذا الیل موجود عبر الاختبارات المتكررة 
زرا ديا وتو بتمط فان فإتها ت تعد أخطاء قافن مخت E‏ 








زج 
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a آخرئ قد تظهز في‎ Aish gutter, LAA. a ells vont 7 


۱ الاختبار ومدی YT‏ آلافادة 
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dis) ma nengan E‏ وإلخطاء تصجيح. as iy‏ ا 
الفحوصين. وتعد ada‏ كافية لتؤثر على elo‏ ء الكکلي في الاختبار ر fhe)‏ تا" ثير الصد(ع علي آداء 


وج موم" ۶ 


ا في الاختبار): آو قد تكون مختميرة دا ومحدثة (مثل نسيان قراءة سوال» آو 
نسيان كتابة مسألة رياضية: آو نسیان الاجابة) . وأعد ستانلي )1971 (Stanely,‏ قائمة تصنيفية 
مفصلة مصادر التباین العشوائي الفردية. وعندما .يعسي ,بچ القحرص: :الاختیان نفیینه thai: ol‏ 


الحشنوائع ال أثرنعلى دزنجة الف 1G‏ 





Visa OT Ba‏ يتكرن في التطبيق التاليء 


te‏ ۰و 





rer apal ۳ ولکنها تبقئ‎ LT eats 


n تب‎ 


Eî ETH العملية. وتقلل الاخطاغ‎ GLa! 
مک اه ثقة‎ sual toy aa 
فمن مسؤوليات مطوري الاختبارات البرهنة على ثبات درجات اختباراتهم‎ Tal بانها متجانسة.‎ 
وتتطلب مثل هذه البراهين دراسات تجريبية تعتمد في الأغلب على نموذج نظري يصف مدى‎ 
الفصل سيتم وصف مثل هذا النموذج‎ laa, تأثير الأخطاء العشوائية على الدرجات. وفي‎ 
النظري الذي له تطبيقات واسعة في دراسة ثبات درجات الاختبار. وسنرکز في الفصل التالي‎ 

على الطرائق التطبيقية لدراسة الثبات الذي يعتمد هذا النموذج النظري. 








نموذج الدرجة الحقيقية التقليدي: 
E‏ ميا هذا النموذج ترجع لمفهوم معامل الارتباط الذي جاء به عالم النفس 
الانجليزي شارلس سبيرمان. فمنذ عام 1904 وحتى عام 1913 کون ښبیرمان ولائ منطقية 
iby‏ بان olay‏ الاختبار عبارة عن قياسات معزخبة لاخطا:الانتیان. وعلى هذا فإن 
الحا طقن ات الاح تيار المعرضة الخطا تكرن أقل من الارتباط بين القيم الحقيقية السمة 
المقيسة )1904 (Spearman,‏ ويمحاولات متكررة لتفسير القياسات المعرضة للخطأ والقيم 
الحقيقية طرح سبیرمان )1913 ,1907 (Spearman,‏ آساس نموذج الدرجة الحقيقية التقليدي. 
وأعاد العدید من المؤلفين آمثال جیلقورد وجولیکسن وماغنسون ولورد ونوفيك صياغة هذا 


النموذج وتوضیحه. وكما هو موضصح آدناد. 








aeee umee مسو‎ a سمي‎ 











Peer WC, i‏ ر 
سا ل a‏ وحم اما Sa‏ 
میس MWA Vi)‏ ار ادو Pp‏ ۱ + 








فقرات ولكنه وضع إشازات خاطةة لفقرتين منهاء لذا فإن درحة اللاحظة تصیح: \ 
es 8‏ مد ا J Eee‏ 
وسارا تعرف اجابات (4) فقرات فقط ولکنها بالتخمین اجابت علی (3) فقرات إحانة 
صحيحة: لذا فإن درجتها اللاحظة تصیعح: 
XK‏ = 4 + 3 = 7 
وأخيراًء يعرف رالف إجابة )8( فقرات» وخسر فقرة لعدم دقته في Bel BM‏ ولكنه خمن 
وبشکل صحيع إجابة فقرة لم يكن يعرف إجابتها. هنا الخطأ الإيجابي حذف that‏ السلبي, 
لذا فإن درجته الملاحظة: ش 
X‏ = 8 - 0 = 8 
وتوضح هذه الأمثلة العددية تأثير الإضافة dso, of!‏ والسالية لأخطاء القياس» ولكنها غير 
نف امارح E‏ جارد CUR‏ یا 






درجات الاختبار كمتفيرات عشوائية 


المتغير هو كمية يمكن أن يفترضها ای شتجمن epee‏ من القيع«وومكن لتحديد المتغير 
العشوائي على أنه المتغير الذي تفترض قيمته وفقاً لمجموعة من الاحتمالات. فمثلاء افترض 
آنك رمیت حجر نرد (له ستة آوجه). یمکن اعتبار عدد النقاط القن تظهر علی الوجه العلوي 
متغر عشوائي. ویمکن آن یاخد هذا التفیر اي قيمة من (1 إلى 6) وفقاً للاحتمالات. ففي 
الرمية الفردة لحجر النرد تظهر فقط قیمة واحدة من القیم الستة, وهذه يطلق علیها «تحقیق 
المتغير العشوائي». ومع ذلك فإن هذا المتغير العشوائي له ستة قيم ممكنة. وعدد cl ys‏ تحقیق 


== 9 


























التغیر العشوائي غير محدد. إن أنه بإمكانك إعادة رمي حجر النرد مرة تلو الأخرى دون 
التأثير عليه. ويؤدي هذا إلى طريقة آخری في التعبير المفاهيمي عن المتغير العشوائي. يمكن 
تصور المتغير العشوائی في مثالنا هذا على أنه توزيع افتراضي لنتاجات رمي حجر الترد. 
فال یاه يمكن اعتبارها عينة عشوائية لنتاج واحد من توزیع النتاجات المحتملة. ومن 


أ احتمالية ظهور أي قيمة هو اله حتی لو كان حجر النرد مصنوعاً بحیث یتسم بالعدل» فلا 
يوجد تأكيد على مثل هذه العدالة. وإذا حاولت تحديد هذه الاحتمالات تجريبياً برمي الحجر 
غدة مد ات» وف أحسنن ال ف نح نقدر الاحتمالية. وذ dis‏ جديدة تتغير 
a 1 ~ON ae 5‏ مس الوا A‏ رورش SL ee oy‏ تفه 
التقدیرات بدرجة قليلة. عه تسه هه )»لس SAAS f 22  p Se‏ 


Ete A 


العشواتي: لاذا نطرح مفاهيمياً درجة الاختبار بهذه الطریقة؟ في البداية لاحظ أن الاختبار 
مؤلف من عدد محدد من الفقرات, فإن كان.الإختبان مؤلف من (50) فقرة فإن پرجة الفحوص 
يمكن :أن تقع في أئ gu gle‏ (1 إلئ:50) وكما هو الحال في نتاج رمي حجر النرد إذ 
يتراوح الدی بين (1 إلى 6). ولا.يمكننا قبل أن یتقدم المفجبوص للاختبار معرفة القلیل أو 
الكثين:عن:أمثلة قلة الانتباه والحخمین: الحظوظ. آی ین الحظوظ وعدم قرامة الفقرة: وهکذا.. 
ذا يمكننا تصور-دزّجة eal‏ في الاختبار غلی انها قيمة جتحتملة ليم یه لجموعة 
احتمالات هيز معزوفة Mag ٠‏ التوزيع المحتمل لدرجات مفحوص واحد يمكن اعتنارها متغير 
عشوائي » والدرجة التي يحصل عليها الفرد فعلاً Leste‏ يأهن-الاختببان.هئ تحقيق لذلك 
القتفیر. المشوائي. ولتخيل كيف يمكن الحصول على هذا التوزيع الافتراضي لدرجات 
الفحوص تصور آن الفحوص تقدم للاختبار مرات عديدةء وبالایحاء للمفحوص بنسیان 
الاختبار السابق, اعد تطبيق الاختبار مرات عديدة. بوضوح فان الدرجات الملاحظة التي 
يحصل علیها الفرد في التطبيقات المتكررة للاختبار قد تنحرف بسبب أخطاء القياس 
الطروحة في بداية الفصل. ويمكن أن يزودنا التوزيع التكراري للدرجات التي حصل عليها 
الفرد بتقدير الاحتمالات التي تغطي درجات الفحوص في أي موقف اختباري. وفي هذه 
الحالة فإن الدرجة الملاحظة (مثل رمي حجر النرد) يمكن عدّها تحقيقاً لمتغیر العضوائي. 








ومن المهم 3 تمييز أن درجة كل مفحوص في الموقف الاختباري تمثل متغير عشوائي مختلف» 
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مفحوص. ويوضح الجدول )1-6( هذه الحقيقة لمفحوصين تقدما لاختبار مؤلف من خمس 
فقرات (لاحظ آن هذا توضیم افتراضي إن أنه لا پمکن ملاحظة هذه الاحتمالات مباشيرة). 
sae DKS,‏ سر ان من كلا مده olay‏ المشطه اقب قدره من این لأن هذه 
الاحتمالای تقترح انها ستحصل علی درجة اعلی من ctu‏ ونلك عند النظر Lead!‏ واحدة من 
کل توزیع. 

جدول (1-6): احتمالات درجات مقحوصین أثنين في عملية اختبارية واحدة. 














(05x5) + (25x4) + (50x3) + (18x2) + )02»1( + )00»0( = (x) 5م‎ 


3.13 = 
(00x5) + (02x4) + (.23 3) + (40x2) + (20x1) + (15x0) = (x) 5م‎ 
ايلين‎ 
1.77 = : 
تعریف الدرجة الحقيقية:‎ 


وبعد أن رأينا كيف يمثل التغیر العشوائي التوزیع الاحتمالي؛ فمن المکن التحدث عن 
متوسط توزیع مثل هذا. فالقيمة المتوقعة للمتغير العشوائي هي اسم آخر فتوسط التغیر 
العشوائي. وعندما نفترض أن متغير عشوائي له عدد لا نهائي من القیم. فإن القيمة التوقعة ل 
× تتحدد LS‏ يأتي: l ١‏ 


yy Pk Xy < =u 


== 1 
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حيث تمثل Ky‏ القيمة K‏ للمتغير العشوائي 
و Py‏ القيمة المحتملة للمتغير العشوائي 
2 > 6 
وفي مثال حجر النرد (إن كان Yule‏ تماماً) فإن القيمة المحتملة لا Py Xx Ke‏ 
Pa 000 Te‏ 


es ee 1 6)‏ مل محل الوذ oe‏ انسلیات ا الستخدمة طريقة 
الدرجة eet‏ ز× فان الدرجة الحقيقية للمفحوص J‏ تتحدد على att‏ 
uxj = EXj = Tj‏ ۱ مس (3-6) 


والقیم المتوقعة لدرجات المفحوصين في جدول (1-6). (وباستخدام معادلة 2-6( هي 3.13 
لسوزان و 1.77 لایلین. ویمکن اعتبار القيمة التوقعة لكل مفحوص على آنها متوسط الدرجات 
التي حصل علیها في الاختبارات جمیعها. . ويتعبير غير دقیق يمكن اعتبار درجة الفحوص 
الحقيقية هي متوسط الدرجات اللاحظة التي حصل عليها من تطبیق الاختبار نفسه لعدد لا 
نهائي من الرات. 





8 حالة ی ی الحقيقية المطلقة فإنه ت sakes‏ د اجتمالية: وخ 
الفحص المخبري للكشف عن هذا الرض» ومن لمكن ی ان 

المريض نفسه. ومع ذلك فان الدرجة. الحقيقية المطلقة للمزيضن توجد: -ويامتتقلالية نائج 
هده الاختباوات. ولا یمکننا | القول با بأن حالة كبد بد الريض ت تتخدد بمتوسط قيع نتائج الاختبارات. 






Sates التفیر: . ویالقایل‎ Bi lea Late tn 
KARY ية القیاس الستخدمة. فاي. اخطاء‎ le اختبار نفسي کلية‎ 
Uda مچین تعزی للدزجة النفسية الحقيقية للفرد في ذلك الاختیار. لهذا فا ن كانت" الدرجة‎ 
وعند قباس‎ dal سمعي أو صعوبة‎ JIS على مقياس وكسلر الذكاء تنخفض باتساق بسبب‎ 
حقيقية مختلفة على كل‎ ola ys الذكاء بمصفوفات رافن التتابعة» فإن الفرد سيحصل على‎ 
رم اختبار روكسلر يحوي عنصر لغوي). بالمقابل. فإنالدرجنة الحقيقية النفسية‎ ERES 




















*منعينة. 


تعريف الخطأ: 






بالنسبة لنموذج الدرجة الحقيقية التقليدي فان A‏ 
الخلاحظة ودرجته الحقيقية. فالخطاً في days‏ الفحوص 0 

(4-6) ل‎ Tj - Xj = زع‎ 

ويعد الخطأ Bj‏ متغيراً عشوائياً. إن أنه الفرق بين Xj‏ (متفير عشوائى) و Ti‏ (مقدار ثابت 
للمفحوص [). ومتوسط توزيع الخطأً للمفحوص j‏ هو القيمة المتوقعة: 

(Tj-X) E = Ej = us‏ ا 

ولتبسيط هذا التعبير GAS)‏ نستهدم قانونين أساسيين للعمليات المتعلقة يالقيمة المتوقعة. 
الآول: هئ أن القيمة المتوقعة للقزق ني متفیرین هی الفرق بين قيمهما القوقعه ذلك يمكن كتابة 
المعادلة (5-6) على النحو الآتي: 

ز ع = €Xj‏ - 81 م۰۰۰۰ )6-6( 

0 Ti -eXj = زع‎ 

lay‏ أن Xj‏ ع = Tj‏ (معادلة 3-6( فان 

SOY 0 = Tj - Tj = ع‎ 

والتفسير غير الدقيق هو أن معدل درجات الخطأ لمفحوص في اختبارات عديدة يساوي 
صفر. 
خصائص الدرجات الحقيقية ودرجات الخطأ: 

من خلال التعريفات السابقة, يمكن اشتقاق مباديء أساسية لنموذج الدرجات الحقيقية 

(0 = Up) 
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4 Ke 


2 الازتباظ بین"الدر‌جات الحقيقية:ونزجات الخظاً لیفجوه 

)0 = Pre) 0۲ 

تر عتا يتقذم المفحؤضين لاختبارين متفه منفصلين of)‏ موقفين اختباريين للصيغة نفسها) 
على افتراكى تیار ھا Aah ee‏ من توزيعين مستقليين للدرجات الملاحظة الممكنة فان 
Lig yi‏ بان جات الخطا للاختبارين = 0 Prim)‏ = 0). 








4/ وهذه المباديء الثلاثة تصف الخصائص الأساسية ole all‏ الحقيقية ودرجات الخطأ 
مما یمکننا من تطبيق نموذج الدرجة الحقيقية التقليدي في دراسة ثبات درجات 
الاختبار. وفيما يأتي وصف غير رسمي لاؤسس النطقية لهذه الباديء والقاريء الهتم 
باشتقاق المعادلات الرياضية يمكنه الرجوع إلى لورد ونوفيك (Lord & Novick,‏ 
P. 37-38)‏ ,1968. ۱ 











افترض أن مجموعة مفكوصين تقدموا LS, LEAT‏ تعلمنا فلكل مفحوص j‏ درجة حقيقية 
رات عديدة على الأداة نفسها أو على أدوات متوازية. لهذا. 
o x‏ ملاحظة ممكنة على الاختبار» لهذا فإن: 


ومتوسط درجات المفحوصين جميعهم في 

81( = ur 

حيث تمثل -j‏ الرمز السفلي على ~E‏ القيمة المتوة 
تحديد متوسط الدرجة الحقيقية للمجموعة ها على أنها: 
لتوسط الدرجات الملاحظة جميعها الذين تقدموا للاختبارات المتكررة 

)10-6( aS up = سل‎ 

ولایجاد متوسط درجات الخطأ للمجموعة UE‏ نتبع الخطوات نقسها: 

)11-6( emek رع‎ 6 E; = Up 











فإن علا = )0( g;‏ 
ومع العلم أن القيمة المتوقعة للثابت هي قيمة الثابت نقسهاء فان 
ug‏ = 0 ..............)2-6( 


ومن pall‏ تذكر أن هذا البدا لا يعني أن متوسط درجات الخطأ للمفحوصين في اختبار 
معين يجب أن تكون صفراً. وتراکمیا فإن By‏ لمجموعة مفحوصين تتضمن مجتمع من الأخطاء 
بقيمة متوقعة gf)‏ متوسط مجتمع) = صفر. وعند تطبيق اختبار واحد على مجموعة تتكون من 
0 مفحوص فان هذا يكافيء اختيار عينة لقيم Ej‏ وياختيار قيمة واحدة عشوائياً من الدرجات 
القطة لكل مخعوسن a le N‏ لير العينة قد ماو از لاستازی ضكر 


الارتباط بين الدرجات الحقيقية والدرجات الخطأ: 


فقيل اله الذي an‏ انبرج الخ ورجا الهلا Bly lens‏ مجن فين 
المجتمع. سنستخدم هذه الإرخاف في ونم مق ی اكور العمودي فيه تدريج 
رات النفظا وق Ege‏ بف ارات اله لتويك أن لكل ممعوص هید عن 
درجات الخطأ ودرجة حقيقية Baali‏ أي أنه يوجد عدد كبير من النقاط لكل قيمة من قيم 
الدرجات الحقيقية. افترض cay, Last‏ آدنی days‏ حقيقية 4 اي مفحوص في الجموعة, 
وتك باعل[ أو آکثر من الفحوه عند هذه الدرجة . فلکل مفحوص في هذا الجتمع. 
وبالتالي لكل مفحوص لهذه الدرجة الحقيقية e‏ =0 وعلی هذا فان مخوسط درجة Una)‏ 
لكل المفحوصين عند هذه الدرجة الحقيقية داح وإذا حددنا درجات الخطاً جميعها 
لهذه الدرجة الحقيقية فإنها ستكون حول المتوكبط صفر, بعدها افترض أننا وجدنا الدرجة 
الحقيقية الدنيا التي تلیها وکررنا هذه العملية. ثانية ستکون درجات الخطاً حول التوسط = 
صفرء وثانية ستکون الدرجات الخطأ حول المتوسط/صفراً وهکذا لكل درجة حقيقية, ویبین 
الشکل (11-6) رسم بياني لأدنى 5 درجات حقيقية 71 ویظهر في الشکل )1-6 ب) قيم T‏ 
UAL‏ جمیمها. ویمکتنا من هذا التمثیل البياني رؤية ی الاوتباط بين الدرجات الحقيفية 
halt,‏ تساوي ضفر وذلك acta‏ اللاحظات المكنة جمیعها لكل الفحوصبن. وهذا يعني أنه 
لا علاقة بين قدرة الفحوص ths‏ القیاس والذي يؤثر على درجة الفحوص اللاحظة في آي 
موقف اختباري. وعلی هذا فان التباین الشترك بين الدرجات الحقيقية ودرجات الخطا = 
ره وان هدا فان قاين الدرحات اللا الكلى ما ي جوم مان الات 
الحقيقية وتباين الخطأ. ومعرفة هذه العلاقة تفيدنا لاحقاً في هذا الفصل. 


== 5 













































ين طبقاً على مجتمع مفحوصين باکمله, وأن ما نعرفه هو درجات الخطاً 
الاختبارين. افترض أن درجة الخطاً لمفحوص ما عالية وموجبة في 
alia‏ إن تخمن درجة LAAN‏ لهذا الفحوص في الاختبار الاي فهل 
Gilley 3‏ ام آنها سالبة (علی افتراض إن اخطاء القیاس توازن 
د من الفقرات؟ الجواب: لا في کل حالة. تذکر أن كل درجة 


تخیل أن ١‏ 
لكل مفحوص في 
الاختبار الأولء وإذا 


Error Score 


+40 


~0 l 
True Score 
-Mean for a Score Croup 


ta) Plot for Selected True Score Values 


Error Score 





شكل (1-6): أمثلة لرسم بياني للدرجات الحقيقية ودرجات الخطا لمجموعة كبيرة من المفحوضين 


أجابوا على اختبار مؤلف من 10 فقرات 





ar" 
ae 


Sas 











ان كل درجة خطا للمفحوص في اختبار ما هي Tie‏ عشوائية لواحدة من العديد من توزيعات 
درجات الخطأ ذات المتوسط صفرء ونتيجة للتعيين العشوائي لا توجد علاقة بين درجات 
الخطأ لحالتين اختيرتا من توزيعين مستقلين. ولان هذا ينطبق على المفحوصين جمیعهم. فإن 
التمثيل البياني الذي يبين نقاط أي تجمع ممكن لدرجات الخطأ من الاختبار الأول والثاني 
یکون مناسباً ال ne Piipan‏ 






fits‏ التبات ومعا التبات: 


باعطاء تعریف الدريجة الحقيقية والخطاء فان الباحثين وا معلمين والحللین النفسیین یعرفون 
فقط الدرجات اللاحظة للاختبارات التي یطبقونهاء مع أن اهتمامهم الفعلي هو الدرجات 
الحقيقية. لهذا فان Lage Yow‏ يطرح حول کم هي العلامة وثيقة بين الدرجات الحقيقية 
والملاحظة؟ أحد مؤشرات هذه العلاقة هو الارتباط بين المتغيرين» ويسمى oles‏ الارتباط عن 
درجة العلاقة بين الدرجات aed‏ والملاحظة «دليل الثيات» „Reliability index‏ 


لكر اه شک just‏ يفن عن /درجة الفحوص الملاحظة بالعلاقة. 
E+T=X‏ / 


f 


[slab وبالدرجات‎ 

/ e + t = X 

وعند استخدام الدرجات المعيارية 0 یمکننا التعبیر عن موّشر الثيات على النحو الآتي: 
t‏ | 

(13-6) vo Or Ox N = Oxr 


ويتعويض قيمة X‏ يصبح التعبير. 


O 
1 = PT 
Or OX 
2 3 
)14-6( Re کا‎ t 4 = Pyr او‎ 
Or OXN Or OxN 









































mep 














ولأننا نفترض ob‏ الارتباط بين الدرجات الحقيقية balh‏ = صف فإن الشق الأخير من 


25 





On2 
(14-6) ........... ee 6 
Gp or أن م‎ 
/ والتي تیسط» وتصیح:‎ 
1 OT 
(15-6) usone د‎ f Ox = ۵ 


لهذافانه يمكن التعبیر عن دليل ات at,‏ نسبة الإنحراف العياري للدرجات الحقيقية إلى 
الإنحراف المعياري لدرجات الخطا. BAY‏ أن هذا الارتباط بين الدرجات الحقيقية والدرجات 
متكررة. ويبدو أن هذا التطبيق له قيمة عملية قليلة 
ية مباشرة, كذلك لا يمكننا الحصول على 
, المکن تخيل عملية اختبارية لجموعة مفحوصين 
ن للاختبار نفسه. وعندما نجد اختبارین يحققا 










~" عه هه 


' لا يمكن الحصول على الدرجات‎ GY 
الدرجات الملاحظة لكل مفحوص ومع ذلك‎ 
فى موقفين باستخدام الاختبار نفسه آو‎ 





1( بالتحديد نقول أنه من الخطأ vac‏ الجموعة ( (X‏ هنا oY‏ إشارة المجموع هذه 


تناسب فقط المجتمعات الحددة, ولا يوجن داعي هنا لتحديد المدى للمجتمع المحدد. في 


التوقع الکرر, والذي قد يكون مريكاً للطلبة أ تجدين. وقد ناقش لورد ونوفيك (1968) 





Og Ox i bak t2% ang 5 
Oz Ox / بما آن = للكت‎ ( 
j Og Ox ) Ox N 


/ 
وياعادة تجمیع هذا الحد يمكننا کتابته بالصورة: ‏ / 





/ (oe د(‎ 
< Og Ox Og OxN 


تمثل القيمة الأولى في هذا التعبير OTE‏ والتي تساوي صفراً. 


والان» 


جه ية 


W. 








متطلبات التوازي من الممكن تأسيس رابطة رياضية OXT‏ الارتباط بين الدرجات الحقيقية 
الحقيقية التقليدي يكون الاختباران متوازیین» إذا تحقق: 
رس الدرسة A E‏ نوا سا isi Mies‏ 










الارتباط بين olde‏ الاختبارات المتوازية. وعندما نحدد معامل الثبات بهذه الطريقة فانه يمكن 
وصف العلاقة cab‏ دليل الثبات ومعامل الشات رياضياً. 


الدرجات العيارية لفحوص على اختبارین متوازیین GUS‏ £1 22 وباسلوب 


هذا النموذج. $ التعبير عن الدرجات الملاحظة على النحو الاتي: 
و = t]‏ مه 6 
t = X2‏ + وه 


وصيغة | رجات المنحرقة عامل الارتباط بين الدرجات الملاحظة 1 ۶2 هى: 






NE 34 PX] X2‏ 2 نی 
Ox2 OxiN‏ 
والتعويض د ذه المعادلة تصیح: 
t (e+ t‏ +مع 
(e2+ t2) 24X | _ iG‏ 





02 6 


وبالحل الجبري/ لهذه الصيفة فانها تصبح: 


Cot eí كارع‎ 6۱11 (int ti 
سیسوس سس 4 مسمس یی‎ 
Oxz Ox, N Ox Ox N Oxo Ox; N Ox9 O 0 = P 52 


وضمن و نمودج الدرجة الحقيقية التقليدي فإن الحدود الثلاثة Bad‏ يمكن 
ملاحظة آنها تساوي/صفراًء ولانه یفترض تساوي قیم الدرجات الحقيقية عبر الواقف 





== 159 = 























ماد چ 


سسبو وس وج 

















160 === 


الاختبارية جمیعها. فان ty‏ = ما و 0×1 = ر×0 (من تعریف الاختبارات التوازية, لذا 


فإن: 
5 کف 
o2 N P Xi X2‏ 
gl‏ 
OF _ PX, Xo‏ ............. )16-6( 
O‏ 


وی هذه العلاقة نلاحظ أن معامل الثبات يمكن تحديده رياضياً على أنه نسبية تباين 
الدرجة الحقيقية إلى تباین الدرجة اللاحظة gf)‏ أنه مربع دلیل الثبات). 
X4 X2 .1‏ م = نسية تباین الدرجات الملاحظة التى 63-23 لتباين Skagi‏ المفحوصين 
الحقيقية. 


2 (ر×»م) - نسبة تباين الدرجات الملاحظة في أحد الاختبارات المتوازية التي يمكن 
التنبق بها من تباين الدرجات الملاحظة على الاختبار الموازي الثاني. 

Pyr 3‏ معامل الارتباط بين الدرجات الحقيقية والدرجات الملاحظة. افترض أن دليل 
اختیار دون قيمة 4 معامل ثیات 1X9)‏ %= 81( ویعد التفسير الآتي كايا عامل الثيات: 

أولاً: يمكننا القول أن 9061 من تباین الف اللاحظة دعحزی ال تباین الدرجات الحقيقية 
للمفحوصين. لذا فان 2م = 81. Ox‏ وإذا كان الانحراف المعياري = 4 فإنه 
يمكننا التنبق بان الإنصراف العياري لتوزيع الدرجات غير الملاحظة يكون: 

جه ,16081 = 3.6 

Lae‏ يمكننا القول أنم|(2):81 أو %65 من تباين الدرجات الملاحظة على الاختبار الثاني 
يمكن التنبؤ به من تباين الدرجات الملاحظة على الاختبار الأول. 

.81 يمكننا القول أن الارتباط بين الدرجات الملاحظة والدرجات الحقيقية (يساوي‎ Lasts 
او 90.) لهژلاء الفحوصین.‎ 

وعند هذه النقطة يجب ملاحظة bls ani ss‏ الجموعة TaN‏ م نطري 











4 a? P 
DEI ريصا صى‎ ota] 


في الفصل السابع مشكلة استخدام درجات الاختبار الحقيقية في تقدير هذه الكمية النظرية. 
ولفاية هذه االحظة سنشیر ببساطة إلى آنه عندما نعوض بدرجات اختبار واقعية علی آنها 
درجات اختبارات hg borer‏ ا فمن gal‏ تسم a‏ الات خی AMS‏ نفد 









3 تشوار وتكائق. و وهذه ه العاملات جميعها وفي الأحوال الخلف من المكن آن کنات من 





يكون الفاصل e‏ متلاشية (صغيرة للغاية), o ee‏ 


مين | 
هر اراس [قم الم 

وعندما يكون الهف الاي رر بر ير معامل hl‏ الجمرعة يرجات فعلية فإن 

Ti ESEN فخ اانا مسن‎ sh 2 Je 


التطبيقية Jena‏ معاملات gha‏ الداخلي البينة في الفصل اساب ولکن فهم 





OLS‏ المركب: 


عرفنا المركب في الفصل الخامس على أنه درجة كلية تعتمد على درجات أثنين أو أكثر من 
الاختبارات الفرغية/دعنا نتخيل الآن أن مطور الاختبار الف صیفتین متوازيتين رمز الأول A‏ 








ت المركبة (م.م)؟ لاحظ أنه عند هذه النقطة يصبح تحايلاً 
اقتراح أن يبني مطور الاختبار صيغتين إضافيتيين للاختبار لیزودنا بصيغة موازية لدرجات 























الرکب الأول. وحتی إذا a‏ ذلك. فان هذا السؤال حول ثبات الرکب یبقی مطروحاً: : ما هو 
ثبات الرکب للاختبارات dad al‏ الأربعة کلها؟ لذا فمن الهم ایجاد طريقة لتحدید ثبات SM‏ 
وفكلا امین ئية للعناصر الداخلية. وفي هذا الجزء سنطرح طريقتين یمکن 
بواسطتهما التخبیر عن ثبات الرکب بوساطة الخصائص الاحصائية لکوناته. تستخدم 
الطريقة الأولى ما یسمی نبیء سبیرمان براون «(Spearman Brown Prophecy)‏ وهذه 
Re‏ رات متوازية عندما يكون ثبات إحداها معروفاً. والطريقة 
ol‏ تستخدم طريقة تعرف بكر)زياخ الفاء وهذه تسمع بتقدير ثبات المركب من معرفة تباین 
دعاق کی وا الشترك عبر عناصره أو مكوناته جمیعها. ولتبسيط هذه المناقشة 
ا البدء بمجموعة اختبر/ات مكوناتها متوازية. وبعدها سنطرح كيف تتأثر النتائج 
إذا لم تكن عناصر الاختبارات متوازية تماماً. 











تسمح بتقدير ثبات مركب | 


نبوءة سبيرمان براون: 
لبدء عملية الاشتقاق) 
aj‏ تقاقها 5 لقياً مما s‏ 


دعنا نعود إلى بعض العلاقات البسيطة التي تعلمناها (آو يمكن 












Ore? 
ale 





1/ يمكننا تحديد ثبات | ب على أنه ۵0۵ = 
لها متوسطات ۳ معيارية وتباینات متساویة» 


يكون bual‏ اختبارات متوازية عددها 16 فان الارتباط بين 


2 القياسات المتوازية 


bY‏ بين أي زوج آخر. 
تبأينات k Mane‏ واشباینات 4 .(1-k)k dae,‏ 
وسنبدا الآن اشتقاق صيغة ثبات مركب. دعنا أولاً نحدد المركب المؤلف من اختبارات 


K basse متوازية‎ 


(17-6)............. k +.. + B + A = E 
وتباين الدرجات اللاحظة للمركب هو:‎ 

; 2 2 Dis 2 

)18-6 Oj OL p 4 + Ox + ray +O% +) o? 


i=j 


حيث تمثل Z‏ م Go‏ مجموع التباينات ASLAM‏ وترمز 1, j‏ إلى أي زوج من 
i= Jj‏ 


fs 
7 K الصيغ الاختبارية من ۸ إلى‎ 











ولآن الاختبارات جمیعها متوازية وقيم Pij‏ متساويةء لذا فإن: 






وأخيراء oF‏ كل j » 1 ge‏ قياسات متوازية» فإنه يمكن اعتبار Pij‏ معامل ثبات الاختبار 1ء 
ولذلك يمكن GES‏ المعادلة )19-6( على النحو الآتي: 

(20-6)....... (oj (-k) 41) ته‎ k ترمد‎ 

وسنستخدم هذا التغبير ليكون مقام ثبات المركب 

والآن دعنا نعود إلى Galt‏ الدرجات الحقيقية للمركب C‏ والتي هي: 
a‏ 0 < ثرر 0 +2 ١ Gr Ti Pa x Op tee‏ .........)21-6( 

ولأن الدرجات ١‏ لكل مفحوص يجب أن تتساوى على القياسات المتوازية 1 oB J‏ 
Pr‏ = 7 للاختبارا . ولأننا نتعامل مع الاختبارات التوازية» فإن 

Ore: SSA‏ 9 شا 


ولأن لدينا تباينات عدد 
cadd‏ فإن: 

وهذه یمکن تبسیطها اکثرألتصیی: 

(22-6)....... o 2-k = فيه‎ 

وبا mi‏ ستخدام صیخ O‏ ) م معادلة 22-6( 9 O‏ (من معادلة 2-6( ی یمکننا كتابة معادلة 
Pea‏ على النحو الآتي: 


2T K2 


DEES‏ د و رين 
Py O +110 2 k‏ 


On? SY‏ / 2 .فان هذا الكسر يمكن تبسيطه ليصيح: 


=== 163 


























۰ لتباين درجات مكوتاته والتباینات أ 








اد 








(23 2O | Pe 

€ 1+ 1-1) م 

وتعد المعادلة )23-6( الصييفة العامة لنبوءة سبيرمان براون, والتي تبين أن ثبات المركب 
يمكن التعبير عنه كدالة لثيات حد مكوناته (على افتراض أن مكوناتها جميعها متوازية) 
وسیطرح في الفصل السايع الاسإتخدامات المهمة لهذه الصيغة في تقدير الثيات» وتطبيقاتها 
الطورة للاختیارات. 





شبات المركب بمعامل Lati‏ 

الهدف الاجمالی لهذا الجزء fa‏ إثبات أن ols‏ الرکب يمكن التعبیر dic‏ بصورة دالة 
تركة للاختبارات التي تولف بمجموعها المركب. وتعرف 
الصيغة التى سیتم اشتقاقها هنا يبمعامل «(Ctonbach, 1957) Lafi‏ والنقاط الآتية ستفيد 
القاريء فى فهم عملية الاشتقاق: 

1 لأي زوج من الاختبارات التوارية تماماً GD‏ يرمز للتباين المشترك بالرمز Oj‏ أو 
Oj O i pj = Oj‏ 
2 عندما يكون الاختبارين 1, ز مأتوازيين تماماً فان تباين الدرجات الحقيقية لاختبار | 

2 

Orr د‎ Oy? 
التباین الشترك الحقیقی لدرجات أي زوج من الاختبارات 1, [ يساوي التباین المشترك‎ 3 


الملاحظ أو 
mj = Oy‏ ۱ 
وپاستخدام هذه العلومات fob Ges‏ نجدد المركب © على أنه مجموع درجات الاختيارات 
الفرعية المتوازية: 
C‏ اح م + 8 +~ k‏ كذلك فان مركب الدرجات الحقيقية 
ily oe Of Tp F Ta = Te‏ تذكر أن تيأين هذه الدرجات: 
Onin; 5 + Org? ..... + Org” + Opa? = Oe?‏ 














منها: 
(-k)k k* 0 =O‏ برت Or;‏ .......)24-6( 


جميعها متوازية. فان تبایناتها وتبايناتها المشتركة متساوية لأي زوج 









كذلك (من النقطة 2 في بداية هذا الجزء) نعرف أن 

02 = ز1ز ۰ ويتعويض هذا في المعادلة (24-6): 

kt) Orit = Ore‏ عارع! -1) بوره 

وهذه يمكن تب 

k? = Org? 

ومن النقطة 3 في بدإية هذا الجزء TH) = Oj‏ "وپتعویض هذا نحصل على 
0 = 12 


وذلك Leake‏ تکون الاختیارات جمیعها قیاسات متوارية. 
وفي الواقف الاختبارية الواقعية لا نکون متأکدین من التوازي التام للاختبارات الفرعية 
التي تؤلف المركب. ٠‏ وفي مله الحالة من المکن استخدام مجموع التباینات الصاحية وتباین 
الکونات لتقدیر الحد (uM‏ لثبات لوكت وكون اله الان للات اقل من قبي معامل 
الثبات, ولاشتقاقه علینا تگوین تباینات BIS‏ 
1 عندما تکون الاختلارات الفرعية k‏ غير متوازية تماماًء فانه يوجد على الأقل اختبار 
فرعي واحد (ولیکن ع) له تباين درجة حقيقية آکبر آو تساوي التباین الشترك له مع أي 
اختبار فرعي OAT‏ أو أن 
غير © > Oj‏ 






== 5 
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والبتاينة الأخيرة ی نتيجة التوسع النطقي للنقطة 2 عبر اختبارات متوازية عددها K‏ 











وتفاصیل الخطوات اللجبرية تجدها موضحة في (۳.89 ,1968 (Lord Novick;‏ وباضافة 
۱ مجموع التباینات الشثركة لطرفي التباينة نحصل علی: 
خرن ۱ 
On?‏ + ي Oj‏ 5 ال لل + < Ojj‏ (6- 28( 
ue l-k |‏ 
ويمكن تجميع مجلوع التباينات المشتركة على الطرف الأيمن في حد واحد: 
ei‏ زگ , ij < E Se <, (1-k)‏ 
l-k (1-k) l-k‏ 
إضافة إلى ذلك فإن الطرف الأيسر للمتباينة هو تعبير عن pe‏ 0% لذا فان 
k 2,‏ 
0 > سس | هر رت .......)6- 29( 


ع التباینات المشتركة (L-K) k‏ للاختبارات غير التوازية تماماًء فإذا 


FI 








وتعرف الصيفة في 1 السرم المعادلة بمعامل الفا. 









الحد الأدنى Joel‏ الدقة a ante Lali las o‏ معرفة عدد 
الاختبارات 0 لفرعية, وتباين الدرجات. ومجموع التباينات المشتركة للاختبارات الفرعية: 
ada‏ العلاقة آکثر وضوحاً إذا تذكرنا أن أي .اختبار يمكن أن يكون AL pa‏ وأن 

هي اختبار فرعي. . وسنرى في الفصل السابع أن معامل آلفا يزودنا بطريقة 

ملائمة لتقدير soll‏ الأدنى لمعامل الدقة للاختبار وذلك باستخدام ably‏ الإجابة على فقر al‏ 





3 ا الأقرادء ومع en‏ المستحيل 5 تحديد aor‏ 
الخطاً eee‏ لدرجة ما. وتزودنا نظرية القياس التقليدية بطريقة لوصف التباين التوقع 
للدرجات الملاحقلة لكل درجة مفحوص حقيقية. 

وتذكر أنه تم تعريف الدرجة الحقيقية على أنها المتوسط أو القيمة المتوقعة للدرجات 
اللاحظة عبر قياسات متكررة عديدة للاختبار نفسه. ويوضح الشکل )2-6( التوزيعات الممكنة 
للدرجات الملاحظة لمفحوصين حول درجاتهم الحقيقية ضمن التوزيع الأكبر لدرجات المجموعة 
الكلية على اختبار واحد. ويوجد انحراف معياري للمجموعة الكلية. ونظرياًء يوجد إنحراف 
معياري لكل توزيع درجات ملاحظة ممكن ولكل مفحوص حول درجته الحقيقية. وعندما Jas‏ 
الانحرافات العيارية الخطاً ی عة الكلية فان الناتج يسمى الخطاً اللعياري للقياس ويرمز له 
بالرمز OR‏ ویمکن اشتقاق تعبیر الخطأ العياري للقیاس باستخدام العلاقة 


O y? = Of? + O, 
ينتج‎ O y? ويتقسيم طرفي المعادلة على‎ 


2 2 


l= 
Ox? + Ox? 


لاحظ أن الحد الأول الأيمن هو تعريف الثبات *«م. لذا فان 





= 7 























Opg? 


2 
Oy 


1= + Pxx\ 





ولحل المعادلة لاستخراج Op‏ » لاحظ أن: 


2 
م‎ ۰۹ -l= Op 
. + og 





۳ 


Examiner? Examince / Esxaaune: A 


شكل (2-6): توضيح افتراضي لتوزيعات الدرجات الملاحظة لمفحوصين 
مختلفین حول درجاتهم الحقیقبه. 


(31 -6)....... ۱ ۱ Pxx\ ~1 \ O x =O, 


فإذا كان الإنحراف المعياري للدرجات الملاحظة يساوي 10ء ومعامل الثبات يى91=0 ؛ 
فان قيمة hall‏ امعياري القياس يمكن حسابها كما يأتي 

03= 091-110 =o, 

وعلى افتراض أن أخطاء القياس العشوائية تتوزع توزيعاً طبيعياًء فإننا نتوقع أن %68 
تقريباً من الدرجات الملاحظة تقع في الفترة 17 © .و %95 من الدرجات تقع في 
الفترة 1 + 1.96 ع 6 آو حول 1 + 2 Op‏ 

وفي معظم الواقف الاختبارية يتقدم الفحوص لاختبار واحد ويكون له درجة ملاحظة 


. واحدة. لذلك فان معرفة الخطأ المعياري للقياس لا يمكننا من تكوين فترة فعلية حول درجة i‏ 


الفحوص الحقیقیه. وذلك PRY‏ القيمة الفعلية للدرجة الحقيقية غير معروفة. ويدلاً من ذلك ك Lub‏ 











نستخدم القيمة المحسوية للخطأ المعياري لتكوين فترة ثقة حول درجة الفحوص الملاحظة 
بصيغة × ± 1ع © » ويمكننا بنسبة ثقة %68 توقع الدرجة ضمن هذه الفترة. وتعويض 
الدرجة الملاحظة عوضاً عن الدرجة الحقيقية ضمن فترة الثقة يعد نوعاً من الخداع ولكن 
الحال ليس كذلك. افترض أن درجة جان الحقيقية على مقياس الإتجاه السياسي كانت (50), 
وان tha‏ القپاس S= cual‏ درجات. LBs‏ إذا تم اختبار gla‏ 100 مرة فان 68 درجة 
من درجاته اللاحظة تق 5 درجات حول درجته الحقيقية. col‏ بين 45 و 55 ولکن 32 درجة 
تقريباً: تكون خارج الفترة 55-45 : 
وإذا كوّنا فترات ثقة حول درجات جان الملاحظة )100 قيمة) فإن 68 قيمة منها تقع بين 
(55-45), وكل من هذه الفترات تتضمن درجة جان الحقيقية. وعملية اختبار جان مرة واحدة 
LaS)‏ هو فى الأحوال العادية) فإنها تماثل أخذ gual‏ درجاته منفردة ويشكل عشوائی من 
وه LOO Ai‏ درجة الملاحظة الممكنة. ففي الاختبار الواحد تكون الفرصة %68 للحصول 
على درجة ملاحظة تقم في الفترة )55-45( وعندما تکوّن فترة ثقة 5 درجات حول gh‏ من 
هذه القیم. فان هذه الفترة ستتضمن الدرچة الحقيقية 50. وان كنا غير محظوظین فاننا 
ستحصل على إحدى ال 32 درجة اللاحظة خارج الفترة (55-45). والفترة 5 درجات حول 
الدرجة الملاحظة سوف لا تتضمن قيمة الدرجة الحقيقية. ولهذا السبب فإنه من الضروري 
تذكر أن أي فرح باحك ماري 3 قد تکون حساباً عرفا لدرجة الفرد الحقيقية. ویعد الخطاً 
العياري للقياس Lage‏ لتزويدنا بمدى sat‏ الدرجة الحقيقية عن الدرجة الملاحظة لمعدل 
الفحوص ضمن اللجتمع, ولكن لا يوجد إتفاق مطلق على أن درجة الفرد الحقيقية تقع ضمن 
فترة الثقة حول الدرجة الملاحظة. إضافة إلى ذلك يجب ملاحظة أن قيمة الخطأ المعياري 
bugi gSa‏ الخطأ المعياري لجموعة مفحوصين. ومن الممكن أن لا يكون منطقياً 
افتراض أخطاء معيارية متساوية للمفحوصين جميعهم. وستعرض إرشادات أكثر تحديداً 
لاستخدام الخطأ المعياري في تفسير الدرجات في الفصل السابع. 


تعريفات بديلة للدرجة الحقيقية والخطأ: 






حتى الان. تعرف الدرجة الحقيقية على آنها متوتتظ عدب .كبير من ب اللاحظة التي 

Leal‏ الفحوص فى موافف اختبارية.م Lia aS‏ نفس اب اختنارات متوازية 
Se cell: faye‏ = للدرجات الم قرف واخطام الو ۲ 
PEET‏ آخری. أحد هذه البدائل المعروفة تستخدم الوقف الاختباري الذي يعد واحداً من 
احتمالات عدة لصيغ اختبارية تتالف من مجموعة كبيرة hag‏ من الفقرات. والقياس الذي 
نحصل عليه في هذه الحالات هو درجة الفحوص لصيغة اختبارية واحدة. ولكن يكون اهتمام 






ي تستخدم 
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القياس هو تفسير أداء الفحوص على مجموعة الفقرات الكبيرة. وأعاد لورد ,1955 (Lord,‏ 
الحقيقية وأخطاء القياس في هذا السياق» والتي يمكن وصفها 
على النحى الآتي: افترض أن نالك Sac‏ كبيرٌ من الفقرات ثنائية الدرجةء Say‏ باستخدام هذه 
الفقرات بناء اختبارين أو AST‏ باختيار فقرات عشوائياً ضمن السیاق, ومثل هذه الصيخ 
التوازية ليس من الضرورة أ ن/يكون لها متوسطات وتباينات متساوية. ولا أن يكون محتوی 
کل منهما مطابقا لاّخر. a td‏ الفحوص 2 الحقيقية هي عدد الفقرات التى يستطيع 
الفحوص الاجابة عنها بصورة , ولكن من الناسب تعریف الدرجة الحقيقية على آنها 
نسبة الفقرات في الجموعة التي يستطيع الفحوص الاجابة عنها بصورة صحيحة (Pa)‏ وإذا 
آردتا تحدید الدرجة الحقيقية fall‏ حوص a‏ على اختبار طوله ثابت. حيث تمثل n‏ عدد فقراته, 
فانها تساوي: 

nPa= Ta 


> yall تعريف‎ 1957, 1959p) 



















ات عشوائياً لصيغة اختبار 8. ومن الواضح أن 8 هي 
ينها من مجموع الفقرات الكلى. وعلی هذا Gla‏ یوجد 
نحوص a‏ ناتجة عن صيغ الاختبارات الختلفة والتي 
تاش ای yaya aul‏ 2 علی انه الانحراف العياري 
حظة حول درجته الحقيقية. ۱ 
طتباري محدد, تخیل بنك فقرات آلي مولفاً من )1000( 
خل إلى علم النفس. وافترض أن الفحوص الیس يمكن 
sel‏ لذا فان Pa‏ = 0.75, وعندما یتقدم اليس للاختیار 


100( فقرة اختیرت عشوائياً من البنك» فان درجته 


افترض آننا صممنا مجموعة ۵ 
صيغة من عدة صیغ ممكتة يمكن 
تتوزع عشوائیاً حول Ta‏ ویعرف | 


التوزیع النظري لدرجات الفحوص a‏ 


النهائي لصيغة اختبار مولف من 
الحقيقية قد تکون: 

75 = )75(100 = nPa 
يجيب على )73( فقرة إجابة صحايحة وهكذا. ونظرياً يمكن أن نحسب الأخطاء ا معيارية‎ 
لدرجات اليس بتكرار اختباره على الاختبارات الممكنة جميعها والمؤلفة من )100( فقرة,‎ 
وحساب الاتحراف المعياري لهذه الدارجات. وفي الواقع نحن لا نقوم بذلك وبدلاً من ذلك توجد‎ 
طريقة عملية لحساب الخطأ المعياري للقياس تعتمد على حقيقة أن التوزيع التكراري لدرجات‎ 
اليس للاختبارات الممكنة جميعها والمؤلفة من (100) فقرة لاختباراث متوازية عشوائية تقارب‎ 














توزيع ذي اين وتوزيع ذي الحدين هو أحد أنواع التوزيعات التكرارية التي تعد مناسبة 
عندما نحسب احتمال رمي قطعة نقدية )50( مرة رأس و (1) مرة ذيل؛ أو )2( مرة رأس و 











(48) مرة ذيل أو (3) مرة رأس و (47) مرة ذيل وهكذا. ونحن نعرف أن هنالك احتمالان فقط 
n‏ ۲ 


۲ 5-075 x 


(32-6)... x -nQ Px = P (x) 





حیت د x‏ (في مثال رمي القطعة النقدية) عدد مرات ظهور الرأسء و 2 تمثل عدد 
الرمیات» و ۳ تمثل احتمالية ظهور الرأس فى إحدى الرمیات. و © تمثل احتمالية ظهور الذيل 
في رمية وا ة. هنالك SIL‏ خصائص للتوزيع ذي الحدين والتي تعد مهمة في الموقف 

۳ تا وت EN‏ این ما لصيغة: 
لا = nP‏ 

2 بحسب تباین توزیع ذي الحدین من الصيغة: 














nPQ 
عند أحساب تباين التوزيع من بيانات العينةء فإن صيغة تباین العينة يكون:‎ 3 
f 
4 
۸ لم‎ 
(33-6)... بش‎ ) nPQ =| 2 
ش‎ AA 
حيث أن |2 ۰ 0 هي احتمالات مأخوذة من بيانات العينة. سس هي تصحيح لحساب‎ 
تباين مجتمع غير متحيز وفي مثالناء فان توزيع درجات اليس الممكنة تشبه توزيع ذي الحدین.‎ 


مجموع عدد الفقرات المختارة والتى استطاع الإجاية عنها اجاية صحيحة. Vary‏ مشايه 
مباشرة لعدد رميات قطعة النقد. وتكرار أي درجة كلية يمكن تحديدها من صيغة ذي الحدين 
فى المعادلة 31-6. 

تعرف فقط الدرجة اللاحظة على هذا الاخثيار (Kea)‏ والسبة اللاحظة الصسمیم1 Poa‏ 


== 1 



































Asi‏ يمكن استخدام هذه العلومات في تقدير الخطأ المعياري للقياس 
الإجابات الصحي زر مة الااحظة Pga‏ تقدير لقيمة المجتمع Pa‏ يمكننا استخدام المعادلة (32-6) 


؟ إذا اعتبرنا نسبة 


















( = ) 5-7 =6,2 
(34 -6)....... A A 
Pga -1 = Qga و‎ Xga+Pga oY ويالاسترجاع‎ 
5 الى أذ‎ ds 
(Xga » Xga , = 62 
(35 -6( 1 


فة حسابية للخطأ العياري للقياس للاختبارات المتوازية 


فالمعادلة (35-6) هي 
رجات الیس الذي حصل على الدرجة )80( على الصيغة )1( 


العشوائية. فالخطاً العياري 


مد جه مها 


المؤلقة من )100( فقرة قد 
- 4.02 


النرجة )50( فى اختبار مؤلف من )100( فقرة اختيرت 
نان الخطاً المعياري الحسوب قد يكون 5.02. وتبين نتائج هذين 
اللعياري ثنائي الحد القياس وذلك العتمد على نظرية القياس 
الحقيقية التقليدي نحصل عادةٌ على قيمة واحدة للخطأ 
| العياري ثنائي الحد الحسوب من درجات حقيقية مختلفة. 
وتكون الأخطاء المعيارية الثنائاة أكبر للدرجات الحقيقية عند الوسط وأقل عند الدرجات 
المتطرفة (والخطأ المعياري Ai‏ الحد يكون أكبر ما يمكن عند =Pa‏ 0.50( ويسبب هذا 
التمييز فإن نماذج الخطاً العیارلي قد تكون عملية أكثر من غيرها في بعض المواقف. 

إن سياق نظرية القياس التظيدية هو قياس الفروق الفردية باستخدام الآداة نفسه! في 
قياس المفحوصين جميعهم» ويكون الخطا المعياري المعتمد على النظرية التقليدية مفيدا ٠٠‏ 
فعند استخدام اختبارات dil‏ لقياس الفروق الفردية (الاختبارات الحوسبة والتي تختلف 
باختلاف المفحوصين) أو التفساير المطلق للدرجات Lase)‏ عن التفسير المقارن) فإن الأنواع 
الأخرى الخطا المعياري تكون مناسبة بدرجة أكبر. والفقرات ثنائية التدريج يكون الخط 







المعياري ثنائي الحد مناسباً لكلا الموقفين المذكورين. إضاقة إلى ذلك فإن النموذج ثنائي الحد 












الذي طوره کیتس ولورد )1962 (Keats & Lord,‏ يمكن استخدامه مع المشكلات التى لا يمكن 
حلها بنموذج الدرجة الحقياقية التقليدي. فمثلاً يمكن استخدام النموذج ذي الحدين في 
حساب درجة الاتساق بين تصانيف المفحوصين وفقاً لدرجاتهم الملاحظة والحقيقية. وهذا مهم 
جدا في الاختبارات المحكية. ویمکن استخدام الخطأ العياري ثنائي الخد في اختبار ما إذا 
كان هنائك مقیاسین یقیسان البلمة نفسها. وهذا مهم جداً في قحص درجات الاختبار. فمثل 
هذه التطبیقات تحتاح لافتراضات آقوی من تلك النتمدة من النظرية التقليدية. ولهذا السبب 
فإن نموذج الدرجات الحقيقية الأقليدي سیستمر استخدامه في مواقف عديدة تتطلب قياس 
الفروق الفردية لأنها تزودنا [plas‏ لمدى واسع من المشكلات القياسية والتى تحتاج لعدد قليل 
من الافتراضات. i‏ 
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التمارين: 
1 في كل من الواقف الآتية بين ما إذا كان saath‏ الوصوف عر الى خطا قياس 
أ- قدر اللاحظ السلوك الارشادي آثناء مقابلة الرشد والسترشد الذي یمیل لاعطاء 
SLY‏ درجات آعلی من الذکور على الفقرات التعلقة بتقاریر السترشدین. 
فسات NE pE‏ 
ج- آصبح جين BB‏ أثناء الموقف الاختباري لدرجة أنها تركت فقرات عدة دون إجابة. 
هت مفحوص في صف ple‏ تفس لم يكتب جملة من المحاضرء أدت إلى إجابته على 
فقرة في الاختبار إجابة خاطتة لأنها اعتمدت على العلومات التى لم يدونها. 
2 تقدم أربعة مفحوصين لاختبار مؤلف من 3 فقرات» ويبين الجدول الآتي توزيع 
افتراضي لدرجات الاختبار للمفحوصين الثلاثة في تطبيقات متكررة للاختبار نفسه. 





تما ال dalle‏ رت 3: 
ب- ما الدرجة الحقيقية للمفحوص رقم 2. 
سج ما تباین الدرجة الحقيقية لهذا الفحوص. 
مها قرا بع PS yee oll‏ 

oe‏ فان تا تسین سر 


== 5 
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و- ما معامل ثبات هذا الاختبار. 

ز- فيما لو طبق هذا الاختبار في موقفین, hel‏ آمثلة لجموعتین محتملتین للدرجات التي 
یمکن الحصول علیها لهولاء الفحوصین. 

ح- فى الواقف الاختبارية التطبيقية؛ هل يمكن تحدید ثبات درجات الاختبار بالطريةة 
المذكورة في و ؟ Ha‏ 

3/ طبق باحث نفسي ثلاث صيغ متوازية لاختبار معياري على عينة البحث. وصححت 
الاستجابات باستخدام الراسم الضوئي. واكتشف الباحث فيما بعد أن هنالك خلل في 
وظيفة الراسم الضوئي نتج عن أخطاء في الدرجات على فترات عشوائية في الیوم 
الذي تم فيه تصحيح الثوراق, ولأن الباحث استخدم فقط متوسط درجة المفحوص عبر 
الصيغ الثلاث رأى أنه لا حاجة لاعادة تصحيح GLORY‏ إذ أن أثر الأخطاء العشوائية 
تم التخلص منه إن يمكن Le‏ متوسطه صفر عبر الاختبارات الثلاثة. قهل هذا تفسير 
صحيح للإفتراض بان متوسط أخطاء القياس يساوي صفرا؟ 

4 تقدم جون لاختبار الاستعداد الأكاديمي الجمعي وحصل على درجة 10 المنحرفة 
قيمتها (135) نقطة. ثم تقدم بعدها لاختبار استعداد فردي وحصل على درجة 10. 
النحرفة قيمتها 110 نقاط. ولاحظ استاذ جون أن الفجوة بين هذه الدرجات أكبر بکثیر 
من الخطاً المعياري لأي من القياسين. ولم يدرك المشرف كيف حدث هذاء واندهش 
أيضاً حول أي القياسين يمكن عده قياسا أفضل لدرجة جون الحقيقية. كيف يمكنك 
تفسير هذا باستخدام نموذج الدرجة الحقيقية التقليدي. 

5 بين أن التباين المشترك للدرجات الملاحظة على اختبارين يكافيء التباين المشترك 
للدرجات الحقيقية للاختبارین, بصيغة آخری اثبت أن: l‏ 


Or Ox xa 


>» xx 5 
( N 5 Oxo (وتذكر ان‎ 





6 - بين أنه للاختبارين المتوازيين آ, [ يكون 
ele = Or‏ 


ب- هل معرفة هذه العلاقة له تطبيقات عملية في تطور الاختبار. 





دق 








نظن ماک نين ا ail‏ ل وداک بجم مرج العترب الخنام gh‏ 
مقیاس دافعية التحصیل (K1)‏ ودرجة الاستعداد الارشادي (262). ووجد alle‏ النفس 
فى دلیل الاختبار معلومات عن الثبات والتباین SI‏ من 261 , 262 والارتباط بین , 262 
aac Gal I‏ رن عن قلت ۷ باستفداء cad‏ اا 

8 يدون جدول )2-6( الارتباطات بين الأجزاء المختلفة للاختبارات الفرعية لبطارية 
التحصيل والمتوسطات والانصرافات العيارية, وثبات الصيغة البديلة للاختبارات 
SP‏ وكلله من E‏ ميقت على Ror E PEE AEN EE‏ 
استخدم هذا الجدول في الإجابة عن ٠ ARENI‏ 


جدول (2-6): بيانات افتراضية في دليل بطارية اختبار تحصيلي لاستخدامها في تمرين 8. 





[- ما معامل الارتباط بين درجات مهارة التعامل اللفظي والدراسات الاجتماعية. 

ب- ما قيمة التباين المشترك بين هذين المتغيرين. 

ج-تتالف درجة القراءة الكلية من جمع درجات الاختبارات الفرعية: مهارات التفاعل 
اللفظي والاستيعاب القرائي. فما قيمة تباين الدرجة الكلية للقراءة. 

د- ما معامل ثبات درجات القراءة الكلية. 
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هد کون عالم نفس معرفي متغير بإضافة درجات BUM‏ واللغة والدراسات الاجتماعية. 
فما قيمة معامل الارتباط بين المتغير الجديد ودرجة القراءة والكتابة. 
فترة يمكن أن تكون درجة الثقة %68 لدرجة الحقيقة المتوقعة. 

ز- من خلال افتراضات نظرية الدرجة الحقيقية التقليدي» كيف يظهر التمثيل بالأزواج 
المرتية لدرجات الخطأ على اختبار الرياضيات والعلوم الفرعية؟ 
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الفصل السایع 
طرائق حساب الثبات 

عرض الفصل السابق نموذج نظري يبين آثر الأخطاء العشوائية على درجات الاختبار. 
وفي نموذج الدرجة الحقيقية التقليدي يحدد معامل الثبات على أنه معامل الارتباط بين 
الاختبار التوازية تماماً. كذلك یصور معامل الثبات على أنه المكافيء لنسبة التباین الملاحظ من 
درجات الاختبار التي تعزی إلى تباين درجات الفحوصین الحقيقية. وعملياً لا يمكن افتراض 
أن مطور الاشتبار آعد اختبارین متوازیین تماماًء إضافة إلى أنه لا يمكن الحصول على 
درجات الفحوصین المقيقية. لذا كيف يمكن الحصول على معامل الثبات لجموعة من 
القیاسات؟ الجواپ هو أن معامل الثبات لجموعة من الدرجات لا يمكن تحدیده بالضبط ویمکن 
حسابه لعينة معينة من الأفراد آجاپوا على عينة محددة من فقرات الاختبار. لاحظ أن مصطلح 
تقدیر (estimate)‏ لا تشير إلى النظر إلى البیانات ووضع تخمین حول الثبات ولکنه حساب 
عددي من عينة البیانات والتي هي تقدیر للقيمة النظرية التي تم اختبارها . كذلك فان استخدام 
الإشارة العلیا " ˆ " للرموز الاحصائية لكل من التوسط. والتباین, والارتباط في هذا الفصل 
تشير إلى أن هذه الكميات محسوية من العينة لا المجتمع باکمله. ١‏ 

إن هدف هذا الفصل هو وصف الطرائق الشائعة المستخدمة في تقدير ثبات درجات 
الاختبار. ويمكن جمع البيانات المستخدمة في تقدير الثبات بطرائق عديدة. ويتو افر على الأقل 
وجهتا نظر لكيفية اختيار الطريقة الأنسب. إحداها هي الطريقة الأمثل التي تؤدي إلى حساب 
الارتباط الذي يمكن الحصول عليه إذا توافرت درجات اختبارين متماثلين تماما وهنا تصمم 
دراسة الثبات لتقليل آثر عدم توازي القياسات وذلك ياستخدام مقاييس تكون أقرب إلى 
التوازي قدر الإمكان. والأخرى (والتي تشكل الأساس في هذا الفصل والفصل التالي) هي 
أن الطريقة الأكثر ملائمة التي يمليها الاستخدام مایت ات الا تمي على مون 
الاختبار أن يحدد مصادر LAS‏ القياس الأكثر ملائمة للتفسير المفيد للدرجات وتصميم دراسة 
ثبات تسمح بظهور مثل هذه الأخطاء وبالتالي تقييم أثرها. 


Aidi الصيغة‎ Aas 





















و 
dp eo‏ ا تامور ا ریم مزع صد اليس PIP‏ 
واه ال و الک مج efi clas cs‏ 
LS ol‏ العام(اختبارالبورد) ولذي طبق تحت ۵ شروط مضبوطة فيموقگ محدد في ید 1 
اختبارية مختلفة تغطي الحتوی SES anasto‏ 
اختلاف درجته كثيراً بغض النظر عن الصيغة الاختبارية التي سيتقدم إليها. وفي هذه الحالة ١‏ 
فان خطاً ی والذي یهت به ا بصورة baa‏ یعود a:‏ اختلافات he aes‏ 


الخاصة بأخوال Crum gdh}‏ قد ۳ Lal‏ في عدم دم تطابق ا . ومن أجل ا هذه > 
العوامل غلی مطون الاختیار تمان oles‏ كات ULERY‏ باستخدام الصبیغ البدیلة: 







نفسه لفترة كافية بين :التطبيقين لإلعا الغبوض ج ea‏ ا و 
لبيق AYNAN‏ يأاعلقالضبيغة الأولى 

iagi‏ 3 بالضيفة الثانية, فين بجین: sok‏ اا :الآخرا تطيق ate’‏ الضنيغة الخانية متتوؤغة:بالصيغة 
الأولى. ویجسیب معام BLOM‏ بين بنجسوعتي البرجات فيما tay‏ وباستخداح:معادلة معامل 
ارتباط بيؤسونء الذي بيطلق عليه إسم معام التکافق. وكلما-كان:معامل:التكافق أعلى كلما 
كانت ثقة مستخدم الاختبان [کبررپاستخدام الضيغ المختلفة بصورة متيادلة JS)‏ مكان (GAY‏ 
ولأي اختبار ذي صيغ عديدة يجب أن يتوافر فيها موشرات للتکافق فيما بينها. 
فالاختبارات التحصيلية واختبارات الاستعداد الدرسی ثبنی وبصیغ عدیدة. إذ أن 
استخدامها في مجالات تحليلية أو علاجية وتربوية وبحثية يتطلب إعطاء فرصة المفحوص OY‏ 
يتقدم للاختبار ثانية, وفي الوقت نفسه لا یرغب مستخدم الاختبار استعمال الفقرات نقسها 
Gabe ats‏ قران سهلة وسریعة all‏ الادتی القبول GLEN Jalal‏ الحشوب: والعدید من ادلة 


الاختبارات التحصيلية القننة تدون معاملات ثبات تتراوح بين (80.)و (90.) لهذا النوع من 
الثیات (التکافق). بالإضافة إلى aoi‏ يجبا تدوين .قيم: المتوسبطات والانجر alik‏ العيارية بوالأخطاء 





Ae 
وقیمها یجپ أن تكون متقارية,جداً فيما لو تم تفسير‎ ay العيارية للقیناس:لکل:ضبییفه. شیارب‎ 
الثبات.‎ Jalal معامل التكافؤ على أنه قيمة تقديرية‎ 





طريقة الابختبار- اعادة الاختيار: 


هنالك العدید من الواقف الاختبارية تکون فیها صيغة اختبارية واحدة كافية. ولکن اهتمام 
مستخدم الاختبار هنا هو LAS‏ استجابة الفحوصین على الصيغة نفسها في آوقات مختلفة. 
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وفي م se are‏ تکون اخ Mes‏ القیاس a‏ هي alsar alty!‏ يجين الملاحظة oe‏ 


E 2200‏ وااو واد امع 
الاتعزافات ull‏ السلوك الأخرى قد تؤثر على الدرجات الملاحظة. ولحساب آثر مثل هذه 
الأخطاء على ثبات درجات الاختبار على مطبق الاختبار أن یختبر مجموعة مفحوصین, وینتظر 
ثم يعيد تطبیق الاختبار على الجموعة نفسها ثم يحسب معامل الارتباط الناتج عن تطبیق 


الاختبار - إعادة الاختبار والذي ۽ يطلق عليه أسم معامل الاستقرار لئست 
abe LF‏ مسر رل 
ویرغب بمؤشر درجة الاستقر ا المفحوصين في الاختبارات المستخدمة في 


تسكين المفحوصين في البرامج طويلة المدى. وهناك القلیل من العاییر التوافرة للحکم على 
أدنى قيمة مقبولة لمعامل ثيات الاختبار - الإعادة المحسوب. ومعاملات الثبات- الإعادة 
للاختبارات المنشورة متوافرة للاختبارات الاستعداد الطبقة baj‏ . وعلی سييل المثال متوافرة 
لقیاس الیول الهنية لسترونج (الطبعة (WGI‏ فمعامل ثبات الصيغة الختصرة (80.) في 





حين أن معامل ثبات ات 0 (60.). ركنا نرى من النقاش | اعلاه لاه فان العوامل المؤثرة 


ع سر ieee‏ 


وسوال مهم يطرح في تصميم دراسة obs‏ الاختبار- الإعادة هو: ما SSAA‏ 
الفاصلة بين التطبيقين؟ لا توجد إجابة واحدة لهذا السؤالء فالفترة ٣الرا‏ یجب آن د 
كافية لدرجة تقلل:من أثن:الذاكبوة أو التطبيق الأول على الأداء في المرة الثانيةء وفي,الوقت 
نفسه ليست طويلة تببمح بتغیرات a‏ لتاريخ لیظهر أثرها ole tia‏ الفحوصین 
الحقيقية: ویجب :أن یخن بعین.الاعتبان الهدف الذي تس تذخ فيه رجات الاختبان لتحديد 
فترة ة الانتظان nda Gay‏ فعلی سبيل المثال ففي اختبار تقييم مستوى التطور النفسحركي 
للأطفال بوجد خطر قلیل لتذکر الطفل استجاباته السابقة. وفي الوقت نفسه هنالك احتمال 
قوي OF‏ يؤدي النضج إلى تغیرات في الأداء فیما لو كان الوقت الفاصل بين التطبیقین طویل. 
وعلاوة على ذلك فمثل هذه الدرچات لا تستخدم في Saal‏ على المدى الیعید ولكنه يستخدم 
عموماً في التخطيط لبرامج فورية للتدخل الطبي أو النفسي والذي يعاد تقو يمه ثانية في فترة 
زمنية قصيرة. وعند أخذ هذه الأمور جميعها بعين الاعتبار فإن فترة انتظار من يوم لأسبوع 
تكون كافية. من جهة آخری في استبانة اليول المهنية للبالغين يتذكر المفحوصون سريعاً بعض 
استجایاتهم على فقرات الاختبار وبعد فترات زمنية طويلة. Lys,‏ فان الیول الهنية تکون 
مستقرة ولفترة زمنية طويلة إذ أن معظم البالغین یعملون في الوظيفة أو العمل نفسه ولفترة 
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وكا ار ای هی اس فسات ما ده القاييس قستخدم في slay)‏ الفحوصین 
للإلتحاق ببرامج تدريبية تربوية أو مهنية التي ت تستمر لأسابیع عدة أو لسنوات لاکمالها. فاذا 
انحرفت میول الفحوصین كثيراً خلال فترة التدريب كما هي مقاسة في هذه الادوات فان 
المعلومات الناتجة تكون ملائمة وتفيد مستخدم الاختبار. 

وتعد الأمور التي تؤخذ بعين الاعتبار ليست مقنعة لجعل فترة الانتظار بين التطبيق تتراو 
بين )©( آشهر إلى سنتين. یالط عن فترة ار bal‏ الهم یآ 







۱ ay 
Jae د الحصول على‎ ot ge يقير اسلة‎ ill و دير‎ Dea, 
نة ان ة التي‎ 5 m SAY 2 sites eN ER ال غير مستقرة؟‎ 
siete 4 الحقيقية‎ o e on ۳ فان‎ oal REAS ل من‎ 














الحالة او کل ye.‏ الذاكرة ue‏ واللل ای E‏ أية آثار ا أخرى للتطبيق الأول. ويوجود 
(fie‏ هذه الأمور فمن الحتمل افتراض أن معامل الاختبار- الإعادة يمثل تقدير غير دقيق إلى 
حدرما لعاضل الثبات النظري. ومع ذلك فإن معلومات عن استقرار clays‏ آلاشتبار تکون 
re‏ لستخدمي الاختبارات في مواقف اختبارية تطبيقية Sande‏ 








ات هد سم سر سم موا = 
طريقة الاختبار- 0 mies ae‏ مرت si PET‏ 
وه ھھ سے مه 1 بر ارق عر ۳ cs‏ 





یمکن حساب معاملات الثبات بالجمع بين طريقتي الاختبار- الإعادة و Asal) ae‏ ی 
(المتكافتة). وهنا تطبق:الصيفةالأولیللاختبار نجفتوةرانتظان ضیف 
كان بالإمكان فمن,الرغوب به أن یکون:تزتیب التطبیق لضفب المجموعة مك الترتيب | النصف 
الآخر. ويعرف معامل الارتباط بين مجموعتي الدرجات على أنه میعاملالاستقران والتكافؤ. 
ويتأثر هذا المعامل بأخطاء القياس الرتبطة ببعاينة الجتوی في ols‏ صيغتي الاختبار وكذلك 
بتخیوات: الا جبربالزمن وبالأخطاء المذكورة سابقاً جميعها . ويكون مثل هثل #التقدين عامل 
الثبات فئ:البعادة أقل من كلا المعاملين التکافق أو الاستقرار المحسوب للاختبار نفسه 
وللمجموعة نفسها. 
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طرائق تتطلب تطبيق واحد للاختيار: 

هنالك مواقف اختبارية عديدة تطبق فيها صيغة اختبارية واحدة een 2 a‏ 
والمثال الأكثر شيوعاً لهذا النوع هو الاختباي الذي جحد 
واحدة ويطبقها على المفوصين جميعهم. إضافة إلى أن bari:‏ لا يتوقع بالضرورة تطابق آداء 
الطلبة في الاختبار عبر الزمن إذ أن الطلبة سيتابعون تعلمهم أو سينسون المادة التعليمنية 
وبمعدلات مختلفة. ويبقى الأكثر أهمية والملائمة الاهتمام gall‏ الذي يعكسه تباين الدرجات 
الملاحظ لتباين الدرجات الحقيقية في الاختبار» وفي وقت تطبيق الاختبار» وكما هو الحال في 
معظم الواقف الاختبارية فإن الفاحص لا يهتم بشكل أساسي بدرجات الفحوصین على 
الاختبار وفي العادة فإنه يستهدف التعميم من الأداء على الاختبار على مجال لمحتوى أكبر 
Z3‏ محتملة aoe‏ أن ن تطرح علی ات ویختبر 0 من ن طرائق ۵ aus‏ 










gi‏ كا الصممة ايان الثبات في هذه AG “soit‏ 9 «طرائق 
pie‏ الداخلي». وطرائق الاتساق الداخلي المطروحة في هذا الفصل تعطي جميعها tas‏ 
عبارة عن دوال لمعاملات الارتياط بين درجات جزآین منفصلين من الاختبار. وفي هذه الطريقة 
e uke Aa‏ الارتباط بين درجات نصفي a‏ فجن 






وكذللإلأخطاء Geta still‏ بخلل في التطبیق آو التصيجيج إو 
الفحوصین. وكذللع:أثودالبيثة التي يجري فيها الاختبار على 
جميعها.قيبتؤشن فن معامل"الاتساق الداخلي. 
وعندماءيكون آداء:الفحوصین laata‏ عبر:فقراتالاختبان يقال بان الاختباناتتجانس. 

وللحصول:علی:مجفوعة. متجانسة من الققرات فإنها يجب أن تقيس الأداء نفسه gf)‏ آنها تمثل 

لز تقفنه. كلك تجن آن تكون مکتوبة پشیکل,جید وخالية من القصور التقني الذي يجعل 
الفحوصين یقدمون استجایات د ان على أ ا معينة غير مرتبطة بالحتوی. bates‏ تؤخد 
تقوات اختبار واحد من مجالات متنوعة (مثل الرياضيات والتاريخ والأدب) فإن آداء 
هه سے 











: Wi 


























3 0598 لایکون متسقاً عبر هذه الفقرات وبالتالي فإنها تؤدي إلى إنخفاض في معامل 
الإتساق الدآخلي. وبصورة مشابهة فعندما تكون الفقرات من مجال واحد كالتاريخ على 
سبيل المثال ولكن بعض الفقرات تقيس مفاهيم أساسية وأخرى تعتمد على مفاهيم ثانوية 
مذكورة في حواشي الكتاب المقرر فقط فإن معامل الإتساق الداخلي يكون منخفضاً أيضاً. 

dai‏ إذا كانت الفقرات.جميعها ممثلة بشكل غير متحيز لمجال المحتوى ولكبعضيها. 
ae‏ للؤب من الفقرة فانه يؤدي إلى تفسير خاطيء السوّال أو d‏ 
N‏ إجابة الفقرة على درجة الوعي بمضمون الفقرة ھک هده Gaa‏ تؤدي 
إلى خفض الإتساق الداخلي للاختبار. ومعذلت فتبرن:التانتسب,بائسا ااعتسقق ربن :هت 
..الاتسیاق:الداخلی ,جلى رآنه:مزشن :لتجانس:متحتوی:الاختبان.ونوعية 

وفي الجزاین الكاليين سنبین طزیقتین واسعتي الانتشار تستخدمان في حساب معامل 
الثبات من تطبیق واحد للاختبار. تعرف الطريقة الأولى باسم طريقة التجزئة النصفية, 
والآخرى تستخدم تحلیل التباین - التباین اللشترك لاستجابات الفقرة. وکلا الطریقتین تؤدي 
إلى معامل تجانس داخلي لاستجابات الفحوصین على فقرات صيفة اختبارية واحدة. 















بطبق مستخدم الاختبار ومطوره بهذه الطريقة صيفة اختبارية واحدة علی الفموصین 
جمیعهم. وقبل تصحیح الاختبار نكري مطور الاختبار الاختبار إلى مجموعتین او اختبارین 
فرعيين يتألف کل جزء من نصف الاختبار الأصلي (من حیث الطول). لهذا فعند تطبیق اختبار 
Iyaa ne came‏ إلى نصفي اختبار کل منهما مؤلف من )10( فقرات. وهدف 
Sleds‏ انتاج:نصفی: اختبار متوازیین قدز الامکان. وتوجد أريعة طرائق ق شائمة 
E‏ الاختبار إلى نصفين ن وهي: 


1( اختیان الفقرات الفريية لتؤلف الاختبار CL geal‏ والغقرات الزوجية لتؤلف الاختبار 








الفرعي اضر 
الفقرات الفردية لتؤلف ا ار الأول ا الزوجية en‏ الاختبار 


الفرعي الثاني. 
3( اختياز فقؤات US‏ النصفین Alpe‏ 
4( تجزئة الاختبار إلى جزآین بحيث يكون هنالك مزاوجة بين فقراب كلا الجزأين من حيث 
RA‏ 
ويعدها یصحی كلا النصفین مستقلاً عن الآخر ویحسب معامل الارتباط بين درجات 
5 مسب 


























وي تم 


المجموعتين الفزعيتين من الفقزات, ويوضح الجدول )1-7( هذه الطريقة. ومفاهيمياً فإن,معامل 
الارتباط هذا هو معامل تکافق نصقی الاختبار. 


جدول )1-7( بیانات توضيحية لحساب معامل ثبات التجزئة النصفية 











التوسط . . 1.6 13 29 
الانجراف العياري 128 119 202 
PAB‏ = 34 


م۵ = 1/(34)2 + 34 = 51 


لاحظ أن معامل الارتباط الناتج عن استخدام هذه الطريقة يكون أقل من معامل الارتباط 
الحسوب للاختبار بأكمله (بشکل عام فإن الاختبار الأطول AST‏ ثباتاً من الاختبار الأقصر 
oY‏ أخطاء القياس الناجمة عن معاينة الحتوی تنخفض). وللتغلب على هذه المشكلة يمكن 
لمطور الاختبار استخدام نبوءة سبيرمان- براون للحصول على القيمة المصححة لمعامل ثبات 
الاختبار الكلي. وعند تطبيق معامل الارتباط لنصفي الاختبار تكتب النبوءة على النحو الآتي: 
2PAB‏ ۱ )1-7( 


vai = Pxx‏ وت و 
PAB‏ +1 








سس 186 

















حيث تشير Pr‏ إلى مال الثبات العدل ea‏ الكلي و PAB‏ 7 إلى eee‏ ان تياط 
فقرات يساوي )34( فإن ne‏ الصهحة المحسوية لمعامل الثيات للاختبار المؤلف من 6 


فقرات تكون: 
2 034 
FR \‏ مسبت OSTs‏ 
ا Dan‏ 
ويجب oe‏ ی معادلة سبیرم ان AA‏ ملاحظة أن هذه الطریقة اندي amd‏ 


كانت النتائج أقل دقة. 


وطريقة بديلة لحساب الثبات من درجات نصفي الاختبار ودون استخدام نبوءة سبيرمان- 
براون اقترحها رولون )1939 (Rulon-‏ وتتطلب طريقة رولون استخدام فرق الدرجات بين 
نصفي الاختبار: ۱ 

OSes p Bo E >. 

E E Sa‏ عت ت اکان E‏ د TERE‏ ف 
oyaa aa aA‏ ع lata‏ لقان انا Ay‏ 
في الصيغة التعريفية Jalal‏ الثبات. لذلك فإن: 

1 


op 
1 = “ورم‎ 


62 ۱ ی 





حساب معامل الشات وکما يأتي: 


224 A 
DAS = »سسس‎ = ۱ 
408 Pxx 


ومع أن طريقة رولون هي الطريقة الأسهل استخداماً في الحسابات اليدوية فإنها تكافيء 
صيغة حساب الثبات بالتجزئة النصفية التي تعود إلى جوتمان )1945 (Guttman,‏ أى فلانجان 
.(Kelly- 1942)‏ 

رك Gy‏ كيت مفصل E‏ كبرق شتا لو هه دا تیه انا نی 
نصفین, ويمكن معالجة البيانات الناتجة عن التجزئة بإحدى الطريقتين 


== 187 



































1) حساب معامل الارتباط بين نصفي الاختبار وتصحيحه باستخدام نبوءة سبيرمان- 
براون. 
2( يمكن استخدام درجات نصفي الاختبار لحساب ثبات الاختبار الكلي بطريقة رولون أو 
جوتمان. ae‏ لعفت بكم و ee,‏ مه 
ما مدی تشابه سم طريقتي سبیرمان- براون ورولون؟ عندما ایتستاوی تباین ديفي 
الاختباز: فان الطريقتين بنذ riy prach hiath ag‏ «نفسها . اضافة إلى ذلك فقد Gy‏ کرونباح 
(Cronbach, 1951)‏ أن تسه f‏ الإنصر افات المعيارية لکلا النصفين عندما تقراوح بين )90( 
و(1.1) فإن كلا الطريقتين تعطي النتيجة TA 3 A‏ تزداد EE‏ العيارنة با هو اد 
فإن معامل سبيرمان- براون تكون قيمته أعلى وبانتظام من ذلك الحسوب بصيغة رولون. 














طرائق:التجر؛ 


طرائق تعتمد على التباين الشترك للفقرات: 

إن الافتقار لطريقة واحدة فر[ حساب التجانس الداخلي لدرجات الاختبار لعينة واجدة من 
الفحوصين وفى تطبيق واطّد. هذه المشكلة كانت محط الاهتمام والأنظار في الأدب 
السیکومتری في الثلاثينات والأربعينات. وبعد ذلك وخلال فترة زمنية قصيرة اقترحت ثلاثة 
طرائق للتغلب على هذه المشكلةا ومع أن هذه الطرائق تبدو مختلفة في الصيغة إلا أنها تؤدي 
إلى نتائج م متشابهة. والطرائو] الثلاثة شائعة الانتشار هي طريقة کیودر- ريتشاردسون 
وطريقة كرويناخ Lill‏ وطريقة تدليل التباين لهويت. وللنین يستخدمون أدلة الاختبارات (Test‏ 
manuals)‏ ومراجعات الاختباول (Test reviews)‏ والادب المتعلق بتطویر الاختبارات يجب أن 
یمپزوا تکافق هذه الطرائق الثلاك لیتجنبوا التشویش, وستستخدم في هذا الکتاب الصطلح 
معامل © لیشیر إلى Ball aba‏ مل الطرائق. 




































isle ردو ے لر ضارا سم ابر‎ Le و دم‎ pty 
و‎ HL ا‎ ahias 
ار م والفكرات‎ PME on تخي چگ‎ Ee نونک‎ 


2 
1 oʻ 

4-7( 0ك دمم‎ l- 

(4-7) A ( 





حيث ترمو 1 إلى عدد فقرأت الاختبار 
تباین الفقرة 1 
و »02 إلى تباين الاختبار الكلي 


ويمكن استاخدام صيغة ألفا (0) لحساب التجانس الداخلي للفقرات ثنائية التصحیح أو 
الدرجات ذات call‏ الواسم من الدرجات (عديدة التدرج) مثل تلك فى استبانات الاتجاهات أو 


lož و‎ 


الاختبارات القألة. على سبيل الثال افترض أن اللفحوصين اختبروا باختبار مؤلف من )4( 
أسئلة مقالية تاراوحت درجاتها بين صفر إلى dp uke‏ وكانت 5,2 =9 , 2رث = 48 
Gyr. 10.2 = 2‏ = 16 » وتباين الاختبار الكلى = 100 , فإن 0 تكون 


16 + 10.8 +4.8 + 9 - 1 


0.80 = ( ) $56 


لتفسير هذه |القيمة على أنها تقدير لعامل الثبات يجب أن نلاحظ أن معادلة )4-7( هي 
ى في التعبير عن معادلة ثبات المركب التي اشتقت في الفصل السادس. 





وفي سياق التطبيق الواحد للاختبار فان كل فقرة تولف إحدى مجموعات ك الفرعية ودرجة 
الاختبار الكلية هي الرکب. وکما Gy‏ في الفصل السادس فان کانت لدینا الرغية فى افتراض 


tales.‏ تماماً فان معامل الفا يمك بان مباشر ta yall Pry J‏ الکية 
الواقف الاختبارية فإنه يتعذر الدفاع عن هذا الافتراض, لذلك نتقید 


أن الفقرات a‏ 
للاختبار. وفي 


(أى أنه التباين المشتؤك الذي يؤثر بانتظام الأداء عبر الفقرات). 


وکا وش al a‏ ال IGN‏ ی کات ا و ا راق مریم 
E Us ae ENA SE a‏ 
ويتشاردسبون.. ۰ (RRB)‏ التی منکن استخدامها Sle oll bis‏ الصممة افیا وقد 
اشتقت هذه المعادلة من قيل كدودر 7 رمتشاردسون )1937 .(Kuder & Richardson,‏ وكاستيصار 
لشكلة التجزئة النصفلة التي فشلت في إعطاء نتيجة واحدة لاختبار معين. والدراسة التي 








== 9 
































قدماها كأرضية تتضمن معادلتين رياضيتين تعرف اليوم ب (KR21 ,KR20)‏ وأُخذت هذه 
KCR20‏ هى: 


مس( 2 -1( 












حیث ترمز > إلى عدد فقرات | 

و »2 إلى تباين الاختبار الكلي 
Pq‏ تباين الفقرة في ] 

وهذه المعادلة مكافئة لمعادلة O Lal}‏ إعند تعويض :0 0j 2 = P;‏ لاحظ أن المجموع يشير إلى 

أن تباين كل فقرة يجب حسابه أولاً ثم جمع تباينات الفقرات جمیعها. ويبين جدول )2-7( 

تتطلب حساب تباین كل فقرة. 


[1A pea 


حيث ترمز ها إلى متوسط الدرجة الكلية. 

,2 © إلى تباين الدرجة الكلي. 

ko‏ إلى suc‏ فقرات الاختبار 

ويبين جدول )2-7( Yia Last‏ لاستخدام/صيغة KR21‏ وعندما تكون الفقرات متساوية 
يقدم تقدير stal KR2i‏ لجموعة درجات الا wee‏ ی وللمعلمين ومستخدمي الاختبارات الذين 
يجرون الحسابات يدوياً أو باستخدام الحاسبة TE‏ فقد يجد معامل 121 كافياً کمد 
أدنى لتقدير معامل الاتساق الداخلي لاختباراتهم. 

طريقة هويت: طور هويت )1941 Hoyt,‏ وباستقلالية عن كيودر وريتشاردسون أسلوياً 














لاحات عامل SAN‏ وی all‏ تا اه لحك الناكمة عن عامل الفا وده اناوت 
5 سا ۽ © ~ ~ 
carga‏ على تحلیل التباين بمعالجة الأفراد والفقرات. على Yat‏ مصادر للتباين. 


جدول (2-7): حعابات توضيحية Jalak‏ التبات KR‏ وذلك لبيانات جدول (1-7). 














4.08 = 62) . 2.02 = Ô, 29 


21م - 6_( 2.9-6)2.9-1(_ ( = 0.76 


(4.08)6 1-6 
0.80 = ( 7 -1( ٩ =KR21 


وباستخدام رموز تحلیل تین العياري فان معامل الثبات حدد على gall‏ الاتي: 

E _MS persons - MS residual _ 
MS persons 

حيث MS persons yadi‏ إلى مريع متوسطات الأفراد المأخوذة من جدول تحليل التباين. 


و20 


و MS residual‏ إلى مربع متوسطات البواقي المأخوذ من الجدول نفسه. ويبين جدول G-‏ 

)7 خلاصة تحلیل التباين للاستچابات البينة في جدول )1-7( ويوضح حساب معامل هویت. 

وقد ريط هويت هذه الصيغة بالتعريف النظري لعامل الثبات. وذلك بملاحظة أن مجموع 

المربعات للاقراد (MS Persons)‏ تمثل تباین الدرجات اللاحظة ومجموع الربعات للبواقی 

: تمثل تباين الخطا في التعبير النظري للثبات.‎ (MS residnal 
گت‎ 


BE =Pxx\ 
O42 


== 1 

















1 
t 




















0.1485 - 0.7574 
| 
0.7574 Pxx 


ولآن طريقة بقة هویت تتطلب معرفة طرائق امسانية اکذرتقیدا من SAM‏ خرى لحساب 
مش لذكرها هنا an‏ د 
رأ في الحقائب المبرمجة الاحصائية مما ودارا 


(afi MAPI eee‏ باي طريقة آخری. . فهذه SEE‏ الپرمج؟ 











وکهدف للقارئ تلخص tagi sla!‏ لتقدير الثبات التي نوقشت في هذا الفصل, فإن 
ae ede o‏ 


ت. 


لے 192 


























۱ الفقرات"‎ E 








الغلاقة يبن تقدیرات ألما والتخزئة النصفية 

من خلال التطورات الحادثة بين عامتى (1935 و 1955) لطرائق تقدير ثبات الاختبار من 
تطبيق.واحد: فمن الطبيعي ارتباك وحيرة مطوري الاختبارات حول الطريقة التي 
سيستخدمونها في حساب الإتساق الداخلي أو كيفية تفسير القيم المحسوية (Coombs,‏ 
(19508. فمن الطبيعى أن يثير ظهور طريقة ألفا والطرائق المناظرة الأخرى جدلاً حول طبيعة 
ols‏ الاختبار نفسه. فمن وجهة نظر النظرین امثال لوفنجر )1947 Loevinger,‏ الذين اعتقدو ا 
أن تجانس الاختبار خاصية مهم للاختبار على الرغم من وضوح الفهوم من وجهة نظر 
النظرية التقليدية لثبات الاختبار والذي يعرف بأنه الارتباط بين صيغتين (آو تصفین) متوازیتین 
للاختبار. واستفسر كيلي )1942 (Kelley,‏ عما إذا كان من النطق الاهتمام olds‏ إحدى صيختي 
الاختیار dos‏ ومن جهة آخری آشار کورتون (1958 (Cureton,‏ وغیره إلى أن الثيات يحدد 
بشکل مناسب على أنه نسبة تباین الدرجات الحقيقية إلى تباين الدرجات اللاحظة. ومن وجهة 
نظر هذا التعریف يبدو من الناسب اعتبار الثبات لصيفة اختبارية منفردة. وتاريخياً فان وجهة 
النظر الاخيرة تم تأييدها من قبل کرونباخ )1951 (Cronbach,‏ الذي وضح العلاقة بين طريقتي 
الفا والتجزئة النصفية. ومناقشته تضمنت النقاط الآتية في التفنتیر: الناستب بلعامل آلفا: 


1) يفكن استخدام معامل الفا :على أنه.معامل.إتنباق داخلي. أنه خاصية للاختبار تدعمها 
حقيقة الارتباطات الداخلية الزجبة بين الفقزات التي تولف الاختبار & :646 | 
Richardson, 1937)‏ وفي تفسير معامل ألفا يجب أن يتذكر مستخدم الاختبار أن کو لمر 


هذا التقدیر لا یوش إلى استقرار دزجات الاختبار عبر الزمن او التکافق مع درجا جرد 
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Gall Joes باسم‎ Cady ا بات النظزي‎ lolak: ai ۷ . 
Jala. و‎ 


3 سينا كلكا ook‏ لته uai‏ 
ولکن بشکل GAT‏ فان كان Jala»‏ ان ات مدوب GEN all‏ امشبوانة al‏ 
الاختبار وحسب معامل رولون فإن معامل آلفا هو القيمة التوقعة لهذا التقدیر. 

4( وأحد المفاهيم الخاطئة لمعامل آلفاء هو أن القن نسبياً لهذا Jalal,‏ تشير إلى 
:أن الاختبار أحادي لبعد (وهو أن lat‏ على هذه لفقرات يمكن تفسيره بوساطة عامل 
(sal,‏ وذلك لأتفبعامل الفا Ua‏ للتباين المشترك بين الفقزإت. ويمكن أن يكو التباين 
المشترك الكبير بين الفقزات نتيجة لأكثز من عامل أ عد.واحد. ولا يجب تفسير معامل 
ألفا على أنه مقياس لأحادية البعد. فعلى سبيل المثال يمكن تفسير الدرجات على 
فقرات اختبار مقالي في العلوم الاجتماعية من خلال قدرات المفحوصين الكتابية ومن 
خلال معرفتهم بالحتوی, لذلك لا يمكن اعتبار الاختبار أحادي البعد (يقيس سمة 
واحدة)» ولأن فقرات الاختبار جميعها تتأثر بهاتين القدرتين فان قيمة معامل ألفا تكون 
عالية لذا يمكن تفسير معامل al‏ على أنه الحد الأدنى من نسبة التباين في درجات 
الاختبار المفسر بالعوامل المشتركة المؤثرة في الأداء على فقرات الاختبار: وقدم 
مکدونالد )1981 (Me Donald,‏ مناقشة أكثر حداثة لهذه القضية عرض خلاله أمثلة 








عديدة مع براهين متعلقة بهذه النقطة. 


وأخيراً: يجب ملاحظة أن folkd‏ الفا قائل للتطبیق علی:وجبه انعم 

فيه ثيبات:المزكب. ويمكن تطبيقه على سبيل اال لتقدير شات الدرچة الكلية المعتمد على 
مجموع درجات اختبارات فرعية عديدة. والإستخدام ASY],‏ تسوعناً far‏ 

فقرة اختبانفرعيء ويمكن اعتبار الحالة الخاصة التي تكون فيها الدرجة الكلية مرك 
لدرجات نصفي الاختبار (مثل تلك التي تستخدم في التجزئة النصفية). ففي هذه الحالة 
ويوجود عنصرين فقط نرمز للمعامل بالرمز (02) وهو مشابه لتقدير Lill‏ المحسوب بطريقة 
رولون أو جوتمان. لاحظ أن النتائج الناجمة عن استخدام )02( تعتمد مكونات نصفي 
الاختبارء وقيمته لا تساوي بالضرورة قيمة معامل )0( الناتج عن معالجة كل فقرة على آنها 
عنصر مستقل في درجة الاختبار المركب. 








eat sate BA Ba |‏ کنر one‏ سر 


so BRI: 











Inter rater Reliability ثبات تقديرات المقدرين:‎ 


تستخدم في بعض أدوات القياس مجموعة واحدة من الفقرات (مثل قائمة السلوكات في 
أستبانة الأداء), ولكن تم aos‏ ملاخظات gi‏ يانات Sure‏ عن :كل مفموهن :من :قبل :آننون :و 
ST‏ .من الملاحظين الذين يقيمون قائمة المقدرين. وفي هذا الموقف يكون الهم تجانس 
الملاحظات آو البيانات عبر المقدرين المختلفين. ولغاية اليوم فإن الأسلوب المفيد في حساب 
معامل ols‏ المقدرين هو تطبيق معامل إمكانية التعميم المبين في الفصل الثامن, بالإضافة إلى 
erate‏ ارس تفای د BL‏ مین Gaal‏ و خی فقرات ا ا 
مجموعة فقرأت) تم مراجعتها من قبل فريك وسمیل )1978 (Frick & Semmel,‏ وهذه العاملات 
تعب تشخيصية:وتختلف مفاهيمياً بعن:تقديرات_الثيات ولا يجب اعتبارها بدائل لتقدیرات 
الثبات ts‏ وصف أدوات الملاحظة. 


al gall‏ المؤثرة في معاملات الثبات: 









من الواضح أن قيمة معامل الثبات يعتمد على تباين الأفراد في درجاتهم الحقيقية 

رجات الخطأ. لذا فإن تجانس مجموعة الفحوصين يعد Lage‏ في تطوير الاختبار وفي 
لتيار الاختبار. افترض أن اختباراً ób‏ لقياس القلق الرياضيء فإذا طبق هذا الاختبار على 
ب صف منتقى في الریاضیات. فمثل هؤلاء الطلاب من المحتمل أن يظهروا مستويات 
شابهة ومنخفضة في القلق الرياضي. لذا فان تباين الدرجات الحقيقية سيكون منخفضاً 
كذ معامل لفات ودا طبق الاختبار نقسه علی مجموعة مساوية لعدد الطلبة ومولفة من 
عرضي من طلبة الرحلة الثانوية. وهنا تکون الدرجات الحقيقية أكثر تبایناًء وعلی 
افتراض ثبات تباين thal‏ العضوائي للمجموعتين التساویتین في العدد فان معامل ثبات 
الجموعة القانية يجب أن یکون آکبر cals GY‏ درجاتهم الحقيقية یمثل نسیة آکبر من تباین 
الدرجات اللاحظة. ویبین جدول )5-7( مثال افتراضي لهذا الوقف الذي یوضع أن الاختبار 
لیس تابت (not reliable)‏ أى غير ثابت (Unreliable)‏ فضلاً عن أن الثيات هوخاصية 
لدرجات الاختبار ولجموعة digas‏ من المفحوصين لذلك یحتاج مستخدم الاختبار لتحدید ما 
إذا كانت تقدیرات الثبات الوجودة في ادلة الاختبارات تعتمد على عينة مشابهة في ترکیبها 
وتنوعها للمجموعة التي سیطبق علیها الاختبار. فإن كانت عينة ناشر الاختبار غير متجانسة 
على السمة القيسة بدرجة کبيرة فان هذا يؤدي Late‏ إلى خفض معامل القبات عند تطبیق 
هذا الاختبار على عينة آکثر تجانساً اوعلی وجه التحدید يمكن القول بأن الاختبار الصعب 
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الدرجات الحقيقية. 


إلى خفض مدن الدرجات. وکذا سیکون تباین 






خلاصة تاريخية للجدل السيكومتري لعدم تجانس 


وقد قدم جوليكسن )1950 (Gulliksen,‏ 
غنسون (Magnusson, 1967, P.75)‏ الصيغة الآتية 


المجموعة وأثرها على alà‏ الاختبار» وقدم ما 
للتنبق بتغير الثبات بتغير تباين العينة: 
Ox? )1- 0 _‏ 


o2 


(T-T) saa... 


1 





= pPvv\ 


حيث fiu‏ 0,2 تباين العينة الجديدة 
و Ox?‏ تباين العينة الأصلية 
و Pxx‏ تقدیر ثبات العينة الأصلية 
ير الثبات التنباً به للعينة الجديدة 

ومن المهم ملاحظة أن هذه المعادلة تفترض تساوي تباينات خط كلا الجموعتین» وأن التغیر 
في الدرجات اللاحظة يعود إلى الفروقات في توزيع الدرجات الحقيقية المجموعة وحيث أن 
مستخدم الاختبار لا يمكنه آلجزم بتحقيق هذا الافتراض عندما تكون العينة المستخدمة مختلفة 
بشکل ملحوظ عن العينة الأصليةء ومن الأنسب هنا التحقق من ثيات العينة الجديدة. 


و Oyy‏ تقد 





جدول (5-7): معاملات ثبات مجمو عتين افتراضیتین تختلف في تباینات درجاتها الحقيقية 


دوه 





إن اعتماد الثبات التقليدي على تباین الدرجة الحقيقية یتضمن أن معامل الثبات كما هو 


فى التعریف له آهمية محدودة فى تقویم نوعية العلومات للستمدة من SAM‏ 


x 


ad 
wa 
ت‎ 
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فى الغريلة آو الإنتقاء. وفى مثل هذه الحالات يهتم الفاحص فقط فيما إذا كانت درجة 
(والنسبة بينهما) له صلة وثيقة آقل يعملية قياس الثيات: وهذا للاختيارات المستخدمة 
بالطريقة التي ستناقش في الفصل التاسع. 

حدود الزمن Time Limit‏ کا فل 2- 


عندما یکون وقت الاختبار محدداً بدقة بمعنی أن بعض المفحوصين أنهوا الاختبار وآخرین 
لم ينهوه» فان مدی عمل الفحوص يؤثر بانتظام في آدائه على صيغ الاختبار جمیعها. لذا فان 
مدی عمل كل مفحوص یصبح جزءاً من تباین الدرجة الحقيقية. وفي بعض الاختبارات (مثل 
اختبارات الاستعداد الكتابية. واختبارات الحساپ الریاضی للبالفین). فقد یکون هدف 
الفاحص تقویم القدرة على أداء الهام بسرعة. وفي آنواع آخری من الاختبارات قد یکون وقت 
الاختبار غیر ضروري بالنسبة للسمة القيسة. وفي هذا النوع من الاختبارات فان وقت 
الاختبار يكون طويلاً Les‏ فیه الكناية لیسمی لعظم الطلبة آو جمیعهم بانهاء الاختبار. هذا ذلك 
فإن تقدير الثبات يكون مبالغاً فية بسبب الاتساق في الأداء الناجم عن الوقت المحدد للاختبار 
وذلك عندما يكون الفاحص مهتماً بدرجة الاتساق في الأداء الاختباري الذي يجب ملاحظته 
في الموقف الذي ينهي فيه المفحوصين جميعهم الاختبار. وستجد في alge‏ لورد ونوفيك | (Lord‏ 
Novick, 1968)‏ & تفصيلات Asi‏ لاختيارات السرعة. 

ويكون التقدير مبالغ فيه بدرجة أكبر للثبات في اختبارات السرعة خاصة عند استخدام 
التجزئة باسلوب اختبار الفقرات ذات الارقام الفردية والزوجية. ومن الواضح أن الأداء على 
الفقرات خارج إطار الوقت الحدد للاختبار على الفقرات المتبقية الفردية والزوجية يكون 
اتساقها تاماً بفض النظر Lee‏ إذا كانت الفقرات متجانسة في محتواها. والأساليب الأخرى 
للاتساق تؤدي أيضاً إلى تقديرات مبالغ فيها للثبات للسبب نفسة عندما يكون الاختيار 
aan‏ سرعة كبيرة, لذا فقد يكون استخدام طريقة الاختبار- الإعادة أو طريقة الصيغ 

فئة أكثر ملائمة لتقدير ثبات اختبارات السرعة. وأسلوب آخر للصيغ المتكافئة هو تقسيم 

are‏ الاختبار إلى نصفين منفصلين وتطبيق كل نصف بصورة مستقلة وضمن الوقت” 
الخاص به. ويحسب ols‏ الاختبار بأكمله فيما بعد باستخدم معادلة إما سبيرمان- براون أو 
TES‏ روسك peal‏ من الطديةه اتمه قا موي ee Nott‏ لصوم يفن 
تفسيرها بحذر Losie‏ تتطلب الهام الاختبارية آکثر من قدرة أداء مهام بسيطة بسرعة 
au‏ 
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طول الاختبار: 
أحد مظاهر الاختبار التى تؤثر بالتاكيد على تباين الدرجة الحقيقية والملاحظة هو طول 
الاختبار. وهذا يتوضع فيما لو نظرنا إلى موف يستخدم فيه الفاحص اختبار مؤلف من فقرة 
واحدة وآخر مؤلف من عشر فقرات (تعتمد جميعها على الحتوی نفسه). ومن الواضح أننا 
نضع ثقة أكبر على الدرجة الناتجة عن الاختبار الأطول. وقد اشتقت العلاقة بين طول الاختبار 
والثيات في القصل السادس من خلال صيغة Be gad‏ سبيرمان- براون: i‏ 
k Pt‏ 


J 


= \ 
1+ (k- 1 لور‎ Pxx 


حيث ترمز "ور م إلى ثبات اختبار فرعي منفرد 

SoU إلى عدد الاختبارات الفرعية في‎ Key 

زرم إلى ثبات المركب 

فان كان ثبات الجموعة الفرعية التفردة تساوي )75( فان ثبات الاختبار المؤلف من 
كي دارا قرف توا كد حلي لاتم اي 


094 _0-75)5 


= \ 
(0.75) 4 +1 Pxx 


5 


كيف يمكن عزو هذا إلى طول الاختبار؟ بصورة أساسية نفترض أن الاختبار الذي بمتناول 
أيدينا هى الاختبار الفرعي <j‏ وثباته الحسوب هو Pil‏ وپاستخدام Ui‏ طريقة مناسبة» نفترض 
بعدها أن الاختبار الجديد مركب ومؤلف من اختبارات فرعية عددها j‏ على أنه عنصر واحد. 
)هي العامل الذي سیتضاعف إليه طول الاختبار. وعلى سبيل JEM‏ إن كان الاختبار j‏ 


` 


ثم إن 


مؤلفاً من )50( فقرة والاختبار بالطول الجديد مؤلف من )150( فقرة فان الاختبار الجديد 
یصور على أنه مركب من ثلاث اختبارات فرعية كل منها مؤلف من )50( فقرة, آو آن SEK‏ 
وعلاوة على ذلك فان k‏ قد لا تكون قيمتها عدد صحیح دائماً آو أكبر من (1). فعلى سبيل 
til‏ افترض أن الاختبار الحالي مؤلف من )100( فقرةء ويرغب مطور الاختبار معرفة مدى 
تأثير الثبات عند تقصير الاختبار إلى )75( فقرة. ولأن 1 هي العامل الذي يجب أن يضرب 
بطول الاختبار وصولاً إلى الطول الجديد )100 (k)‏ = 75( أو أن oB .).75 =K)‏ كانت . 
0.60=p,!‏ فان ثبات الاختبار الجدید القصير یکون: ۱ 





11 0: 








(0.60 ) x 5 


<a 0 5‏ *, ی جن هه re‏ 0.53 
4 1+ )1-0.75( 0.6 


وعندما يزداد طول الاختبار فإن قيمة k‏ تصبح أكبر من )1( وعندما يقل طول الاختبار 
فان قيمة K‏ تصبح أقل من (1). ويجب ملاحظة أن الزيادة في ثبات الاختبار الناتجة عن زيادة 
طول الاختبار تتبم قانون تناقص الغلة (وینص هدا القانون علی أن زيادة العمل آو راس الال 
إلى أبعد من نقطة معينة لا يترتب عليه زيادة مناسبة في الانتاج) وة à‏ 
ھت آن مضاعقة طول اختبار ثباته (60.) يزيد ثياته إلى )75 وسیزید ثلاثة اضعاف الطول 
قاف الاختبار إلى )81( ولکن مضاعفة الطول إلى خمسة Glaus)‏ طوله اتصلی سیزید 
الثبات إلى (88.) فقط. لذلك وعند نقطة معينة فإن الزيادة القليلة فى الثبات الناتجة اضافة 
فقرات من للحتمل أن لا تغطي كلفة كتابة الفقرات الاضافية والوقت الستهلك في تطبیق 
Lis‏ وعلاوة على ذلك فان تصحیح سبیرمان-براون هو انعکاس دقيق للثيات 5 5 
كانت الفقرات المضافة أو المحذوفة موازية في الحتوی والصعوبة لفقرات الاختبار 5 bs‏ 
(. لذا فإن أي قيمة متنباً بها للدرجة الحقيقية لفرد معين ستكون أقرب إلى وسط المجموعة 
من الدرجة الملاحظة الأصلية. إضافة إلى أن معامل الثبات الأقل يؤدي إلى أن الدرجة 
الحقيقية التنباً بها أقرب إلى وسط الْجموعة, وعندما تكون قيمة Myy‏ = صفر GY‏ فرد فإن 


مه ین 


قيمة 1 تقترب من قيمة ×. 

ولان الدرجات الحقيقية القدرة يمكن حسابها بسهولة فان مستخدم الاختبار العرضي قد 
يدمي استخدامها علق اساس أن الدرجة الحقيقية القدرة ینتح عنها قرارات اکثر ملاشمة عن 
الفحوصین. ولیس من الضروري أن یکون الوقف بهذا الشکل, وکقانون عام لا توجد ميزة 
لحساب الدرجات الحقيقية لمجموعة واحدة من الفحوصین التي ستتم مقارنتها على أساس 
معياري- الرجع. ومستخدم الاختبار الذي سیحسب الدرجات الخام والدرجات الحقيقية 
القدرة للطلبة سیجد أن وسط كلا التوزیعین هو نفسه, اضافة إلى أن ترتیب الفحوصین 
نشیکون هق ك لکلا الف ن وفقط abs‏ ا(تحرافات الغيارية لکلا القوزرعن عبت بگون 
الانحراف العياري للدرجات الحقيقية هو الأقل. ۱ 




















تقدیر الدرجات الحقيقبة: ورن 
, مع أن قيمة الدرجة الحقيقية لفحوص معين لا يمكن تحدیدها بدقةء لکن (Sas‏ الحصول 
على تقدير لها من خلال معادلة الانحدار العامة للتنبق بقيمة ¥ من خلال قيمة معروفة X‏ 


O. alt ies 
y ند کر ان‎ 
u, + By =Y] 9 
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nm amis سا‎ emn memm ل‎ en 


وبالتعويض ب :عم ل To Pxy‏ للل 
سر + PxT SL 6 u‏ 
Ox‏ 
ولان 
OT‏ 
و 0۲ a oT‏ 


2 £3 
Pxx = Pxr و‎ 


و Up‏ = پل » بالتعويض المناسب نصل إلى: 
pede: Po Xu) + r=‏ یو 
وإن أعدنا كتابة العادلة )9-7( بدلالة الدرجات المنحرفة حيث أن: 
ty‏ ع يم ~ 1 
و > = پر - x‏ نصل إلى: 
۵ = ون Pxx‏ 
وحيث أن أي تقدیر (KS‏ امرجم یعتمد على بیانات حقيقية يكون”أقل من )1 لذلك فإن O‏ 
ستکون آقل. 
وفي الواقف التي سیتم فیها تحدید مواقع مختلفة للمفحوصین اعتماداً على تواجدهم 
أعلى آو ادنی من نقطة معينة فإن استخدام الدرجات الحقيقية القدرة سيژدي إلى نتانج 
مبهمة يجب التحقق منها بجدية قبل التطبیق. خذ مثلا الحالة التي سیوزع فیها الطلبة على 
برامج علاجية أو خاصة اعتماداً على نتائج الاختبار. فالطبة الذین درجاتهم أقل من )80( 
سيتم وضعهم في صفوف العاقین عقلياً القابلين التعلم» والطلبة الذين درجاتهم أعلى من 
)130( سیتم وضعهم في صفوف الوهویین. 
افترض أن جوزیف حصل على درجة )79( في اختبار الذکاء وکارین حصلت على درجة 
)132( سيعامل کل منهم عل أنه حالة خاصة وتقدم af‏ شومات Sly Teale‏ باستخدام 
الدرجات الحقيقية المقدرة عندما يكون وسط الجموعة )100( و ربب = ۰.90 فان درجة 
جوزيف الحقيقية المقدرة تكون: 


81.1 = 100 + )100 - 79) 9 = T; 





euen gg i n کا‎ deme a er ینم ی‎ 








5 عو وم‎ ct 





ودرجة کارین الحقيقية القدرة تکون: 

128.8 = 100 + )100 - 132( 9 = Tk 

ومنها نری أنه لا يحتاج أي منهما إلى برامج خاصة. بالمقابل آنظر كيف ستتغیر النتائج 
فیما لو استخدمت وسط الجموعة الفرعية (العاقین عقلیا) Yas‏ من وسط الجموعة الكلي. فان 
كان وسط هذه الجموعة )65( فإن درجة جوزیف الحقيقية القدرة ستکون: 


77.6 = 65 + (65 - 79) 90 = T 


وبالاعتماد على أسس الدرجة الحقيقية المقدرة سيتم تصنیف جوزیف على أنه Glas‏ عقلياً. 
ویوضح هذا الال آهمية تحدید الجموعة العيارية الناسبة فيما لو استخدمت الدرجات 
الحقيقية القدرة لاتخاذ قرارات تتعلق بالفحوصین. 

وكقاعدة dale‏ من الأفضل استخدام وسط الجموعة الكلية Yas‏ من أوساط الجموعات 
الفرعية التي تعتمد على مجموعات صغيرة نسبياً وبالتالي تکون غير مستقرة. فهو تطبيق 
معرض للتساؤلء إن تولد مجموعات فرعية اعتماداً على درجات الاختبار ومن ثم استخدام 
أوساط الجموعات الفرعية فى تقدير الدرجات الحقيقية على الاختبار نفسه أو اختبار مشابه 
له LS)‏ تم توضيح ذلك في الثال السابق). إن استخدام أوساط المجموعات الفرعية في تقدير 
الدرجات الحقيقية تكون مُسوفة عندما تكون الجموعات الفرعية معتمدة على متغیرات 
دیموغرافية طبيعية أو تعليمية تدريسية لا علاقة لها بالاختبار. على سبیل الثال عند تقدیر 
الدرجات الحقيقية للسود والبیض والاسبان نامل استخدام وسط الجموعة العرقية الفرعية لا 
وط EAs Ere‏ 






ذلك ففي المواقف يكون تقدير الدرجة الحقيقية غير ضروري» وسنبين باختصار 
أن هنالك أنواع من البحوث أو التقويم حيث يفضل ير للدرجة الحقيقية. والمشكلة 
القن sgh‏ فى تعن الور امسات هق مفازنة مهادت cla!‏ ت غ ای AST‏ الي PEO‏ 
غير متساوية على المتنبيء. وقد تظهر هذه المشكلة عند استخدام تحلیل التباين المشترك في 
تصميم المجموعات غير المتكافئة (1963 (Campbell & Stanely,‏ وكذا في دراسة تحيز 
الفقرات. ان استخدام الدرجات الملاحظة يمكن أن يخلق مجموعة فروق في معادلات الانحدار 
التى قد لا تظهر فيما لو توافرت الدرجات الحقيقية. وقد بين هنتر وکوهن (Hunter & Cohen,‏ 
)1974 إن استخدام الدرجات الحقيقية المقدرة قد يتغلب على هذه المشكلة في الانصدار 
الخطي ويقللها في تحليل الانحدار غير الخطي. 


ثبات الفروق في الدرجات: 
هنالك مواقف بحثية وتقويمية وتحليل تشخيصي يطبق فيها اختباران, والمتغير الذي يهتم 
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اع 
> هو الفرق بين الدرجات على الاختبارين» وفيما يأتي مثالان واسعا الانتشار ينطبق عليه 
l AIRY.)‏ 
الاختیار نفسه. 
0 
2( محلل نفسي متخصص في صعويات التعلم مهتم في الفجوة في أداء المفحوصين على 
اختبارین أو على اختبارين فرعيين (مثل درج ت الاختبارات الفرعية في تطور اللغةء 
درجات الاختبارات الفرعية فى انتاج اللغة). ۱ 
ففي كلا الحالتین المتغير الذي نهتم به هو الفرق في الدرجات. والذي يُحدد على النحو 
الآتي: 
X - Y =D)‏ 
حيث تمثل X‏ الدرجة على القياس الأول 
y 5‏ الدرجة على القياس الثاني» فإن كانت القرارات عن الأفراد ستُعتمد بناءاً على 
فروق الدرجات فيجب حساب ثبات الفروق في الدرجات. 
ويمكن اشتقاق الصيغة التقليدية لحساب ثبات فروق الدرجات على النحو الآتي: 
في البدء يمكننا تمييز الفروق بين الدرجات الحقيقية على التغیرین ‏ و لا كما يأتي 
T; - Ty = Tp‏ 
وحيث أن كل من D‏ و TD‏ عبارة عن مركبات GLA‏ للدرجات الأخری, فان تباينهما يمكن 
التعبير عنه على النحو: 
20xy = OD‏ - بط 0 + ,2 O‏ 
و O Zey + Ory - 26 = Opp?‏ 
ومن التعریف الأساسى للثبات نعرف أيضاً آن: 
oF, = 02‏ 0 
Pxy` a; = Ory ols‏ 


كذلك» فقد عرفنا من الفصل السادس أن: 


OTxTy = Oxy 











a 


i 1 


iF 








ویاجراء التعویضات الثلاث يمكن التعبیر Ge‏ مب من خلال الدرجات اللاحظلة على 
النحو الاتي: 


2 = پ0 2- Oey‏ رم ,02 لبويوم 


ومن خلال التعريف النظري لثبات الفرق بين الدرجات: 
Zm‏ م 
١ oy = Ppp‏ 


وبإجراء التعويض المناسب لكل من : م02 و Opp‏ 

والتعبير عن Oxy‏ بدلالة ,0,0 Py‏ نصل إلى: 

Pxxx 02 F Pyyx oy 2 Pxy OxOy = Ppp 

07, + 0%, - 2 Pry O,0y 

ولنرى كيف نطبق هذه الصيغة عملياًء افترض أن الباحث خطط لدراسة الأطفال الذين 
يظهرون فجوة بين قدرتي إنتاج اللغة وعملياتها. ويبين الجدول )6-7( بيانات افتراضية لهذا 
الثال» فإن وجد الباحث ارتباطاً بين إنتاج alll‏ وعملياتها Py)‏ = 70.)» فان ثبات الفرق بين 
درجات الاختیارات الفرعية سيكون: 


جدول (6-7): حسابات افتراضية للوسط الانحراف العياري, 


الثبات للاختبارات الفرعية في إنتاج اللغة وعملیاتها للأطفال. 





(8) (6) (0.7) 2 - (64) (0.8) + (36) (0.75) ~ Ppp’ 
(8) (6) (0.7) 2 + 64 + 36 
۱ 0.34 = 
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ye‏ جهة آخرى» إن كان الارتباط بين الاختبارات الفرعية Py)‏ = 30( فإن ثبات الفرق بين 


الدرجات سيكون أعلى. 
)0.75( )0.36( + )0.8( )0.64( - 2 )0.3( )6( (8) ` = 069 
eh il de‏ سس ا 


(8) (6) (0.3) 2 - 64 + 36 = Ppp 


لذا نرى أن ثبات الفرق بين الدرجات يكون آکبر عند اختيار اختبارين أو مقياسين ثباتهما 
Jle‏ ولكن الارتباط بين القياسين منخفض» ومع ذلك توجد استثناءات في بعض الواقف لهذا 
القانون. فعلى سبيل الشال: أجرى زيمرمان ووبليامز )1982 (Zimmerman & Williams,‏ 
تطبيقات لتجميعات شروط كانت فروق الدرجات فيها ثابتة مع وجود ارتباط لها مع درجات 
الاختبارات القبلية. 


استخدام تقديرات الخطأ في تفسير الدرجات: 

قد تفيد تقديرات الثبات في القارنة بين درجات اختبارين آو أكثرء ولکن عند تفسير درج 
الفحوص كفرد فإن معامل الخطأ المتوقع في درجة الاختبار تكون أكثر أهمية. وتاريخياً فإن 
ثلاثة آنواع من الأخطاء تم تحديدها بالأساس من قبل كيلي (1927 (Kelley,‏ وتعد ملائمة في 
تفسير درجة ألفحوص, وهي: 

2 الفرق بين درجة الفرد اللاحظة على اختبار والدرجة التوقعة على صيغة اختبارية 

3( الفرق بين درجة الفرد الحقيقية ودرجته الحقيقية المقدرة. 
للقياس. وكما لوحظ في الفصل السادس يمكننا تصور hall‏ العياري للقياس على أنه 
الانحراف العياري للفرق بين درجة الفحوص الحقيقية ودرجته الملاحظة لعدد لا نهائی من 
الواقف الاختبارية المتكررة. وکتقدیر الخطاً العیاری للقیاس يمكن تحدیده باستخدام الصيغة: 


۸ س 
Ox 1 l- Px’ =OR‏ 


' وتمثل .0 الانحراف المعياري الدرجات الملاحظة للمجموعة كلها و ارم تقدير الثبات» 
)30( ۱ 





HRR ° - 


y 


سمي سدع 
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ویتطلب تفسیر الدرجات باستخدام القطا العياري تأسیس فترة هة حول الدرجة اللاحظة 
نتوقع آن تقم الدرجة ضمنها. وسنستخدم في الناقشة التالية الخطاً العياري للقیاس» وتطبق 
هذه النقاط بالطريقة نفسها على الاخطاء من النوعین الآخرين (الخانی والخالت). وتذکر من 
الفصل السادس أن الصيغة العامة لفترة الثقة باستخدام الخطا العياري القی اس 
هي:( (Op 17 xX‏ إن آردنا أن تکون درجة الثقة )%68( GY‏ تقع الدرجة الحقيقية ضمن 
الفترة. آما إن آردنا أن تکون درجة الشقة بنسبة (M95)‏ فان الفترة تکون (ÔE 196 F‏ 
x)‏ حول( + 682 ) 

ویوضح جدول )7-7( استخدام هذه الصيغة والقیم الناتجة عن تطبیقها على الدرجة 
الملاحظة لفحوص على اختبار معین. وكذلك يبين الجدول التفسیر باستخدام فترة الثقة هذه 


جدول (7-7): الصیغ والحسابات والتفسیرات لدرجات الثقة 
باستخدام تقدیرات الخطاً المعياري للمفحوص نقسه 


A 
[0.75 =P, «< 10=6, =O, , 2624] 
تفسير فترة الثقة 9695 لمفحوص‎ 
(30) tad درجته‎ 


نثق و P‏ 5 %95 بأن درجة 


by ۱‏ یت الحقدقعة قرف By zal‏ 
OE‏ = ۱۵ 1 - 0.75 شارلوت الحقيقية تقع في الفتر 


40-20 | 5-6 
= VE 


| الخطا المصسيساري وره = لام 1 | 0x‏ 660 13.230 نثق بنسية %95 أن شارلوت لو 


أعيد اختباره على اختبار موازى 
r : R‏ 
2 1۱102 - (0.75) فإن درجته على الاختبار الثاني تقع 


في الفترة )16.8 - 43.2( 
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للمفحوص نفسه. ومن الهم تمييز أن )795( من الفحوصین الذين تقدموا للاختبار تقع 
درجاتهم الحقيقية ضمن فترة الثقة الممسوية بهذه الصيغة. لذلك ولفحوص معين مثل 

شارلوت فإن ) هنالك فرصة %95 بأن فترة ثقة حول درجة الملاحظة تتضمن درجته الحقيقية. 
ومع ذلك لا يمكننا القول بأن كل مفحوص ويثقة مطلقة بأن الفترة تتضمن تتضمن درجته الحقيقية 
(فقد يكون شارلوت أحد ال %5 الذين تقع درجاتهم الحقيقية خارج هذه الفترة). إضافة إلى 
أنه ليس صحيحاً لجميع المفحوصين الذين حصلوا على درجة ملاحظة معينة (مثل 30) بأن 
تكون %95 من درجاتهم الحقيقية تقع ضمن فترة الثقة المحددة. 

في العديد من المواقف في تفسير درجات الاختبار مع الطلبة نفسهم أو والديهم آو 
المرشدين لا يكون هنالك جدوى من مناقشة الدرجات الحقيقية معهم. وییدو أنه أكثر جدوى 
ونفعاً مناقشة الدرجة التي سيحصل عليها الفحوص فيما لو تقدم لصيغة موازية أو بديلة 
للاختبار نفسه. وفي مثل هذه الحالة يستخدم الخطأ من النوع الثاني والخطأ العياري للتقدير 
Sal‏ بدرجة الفحوص على الصیفة 2 من درجته الملاحظة على الصيغة 1 تكون على النحو 


الآتى: 
2 3 
Ox2 ۲ 1 =Px,\ = O12‏ 


ast,‏ فان الحسابات والتفسير الاحصائي مبين في الجدول (7-7). ومن اللفت النظر أن 
فترة الثقة الناتجة عن استخدام الخطأ المعياري للتقدير تكون آکبر من فترة الثقة المحسوية 
بناءاً على الخطا المعياري للقياس. وهذا مطقي. فإذا تذكرنا أن الخطا المعياري للقياس على 
الاختبارين الأصلي والصيغة البديلة سيؤثر على فترة الثقة الثانية. 


تدوين بيانات الشات د 


بقع على عاتق مطور الاختبار الالتزام بمسؤوليته ليس حساب ثبات درجات الاختبار في 
ظروف مختلفة فحسب. بل أيصال هذه المعلومات إلى مستخدمي الاختبارات على هيئة 
معلومات. وقد قدمت الرابطة المسماة المعايير للاختبارات التربوية والنفسية (AERA-APA‏ 
NCME, 1985)‏ وسابقتها المعايير للاختبارات التربوية والنفسية (APA, AERA NCME,‏ 
)1974 بارشادات Lage‏ للمعاییر التي يجب أن يراعيها مطور الاختبار. ومن هذه الارشادات 
النقاط الآتية والتي تناسب الفصلین السادس والسابع وهي: 

1( يجب كتابة نتانج دراسات ثبات مختلفة لتؤخذ بعين الاعتبار مصادر الخطأ المختلفة 














والاکثر ملائمة لاستخدام الدرجات, ومع ذلك فمن الناسب كتابة مؤشرات الاتساق 
الداخلی لغير اختبارات السرعة, ولا تعد مثل هذه الأدلة بديلاً عن المعلومات حول 
استقرار فرجات لحار 

2( الاخطاء العيارية القیاس ولتجمعات ola pall‏ لفترات الثقة الختلفة یجب آن ترافق کل 
تقدیر للات ویجب أن تکتب الأخطاء العيارية بوحدات التدریج لكل الدرجات العيارية 
التوافرة. 

6 نج اة يراد الكنات Slag etal UN,‏ شا رات الم عدا هو اكان 
لدرجات الاختبار الكلي. ۱ 

4( يجب وصف الطرائق والعینات الستخدمة في دراسات الثبات وصفاً كافياً لیسمح 
للمستخدمین تحدید التشابه بين ظروف دراسة الثبات والوقف الخاص بمستخدم 
الاختبار. 

5( عند استخدام الاختبار لجتمع مفحوصین معين له التوزیع الطبيعي fie)‏ طلبة مستوی 
م مسن ental‏ الاعاقات etal‏ يميا ol‏ شوق ol pats‏ السات UAT,‏ اه 
العيارية لها م 


6( وعندما تستخدم درجات الاختيار بصورة أولية فى وصف آو مقارنة آداء مجموعة 
7( إذا حسبت الاخطاء العيارية للقیاس باستخدام آنموذج معين مثل الانموذج ثنائي الحد 
يجب الاشارة إلى ذلك وعدا ذلك فان مستخدمي الاختبارات یفترضون أن القیم 









| الاختبار- الإغادة, وأسلوب الصيغ المتكافئة | 
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1 وقي ي تفسيو درجات peer‏ توجد على seua ai <J‏ من أخطاء الة 








1 حدد نوع الثبات الأكثر ملائمة لكل موقف من المواقف الآتية: 
آ- يرغب معلم التحقق من ثبات اختبار نهائي في الأحياء فقراته من نوع الاختيار من 


مكلف . 

ب- يرغب عالم نفس ارشادي في تطوير استبانتين للاتجاهات واحدة لاستخدامها 
كاختبار قبلي والأخرى كاختبار بعدي في برنامج تربوي يستغرق يوم واحد. 

ج- طور عالم نفس اجتماعي اداة تقييم اتجاهات للمسجلين الجدد في ASH‏ وأعطى كل 
فقرة نقطتين لاستجابة «نعم». ونقطة واحدة لاستجابة «ممكن» وصفر لاستجابة Sy‏ 
واجاب اتحنتم عن الاستبانة UST‏ الاسبوم الارشادي. 

د- صيفة اختبارية واحدة لاختبار تحصيلي يغطي العلوم الصحية بفقرات ثنائية 
التصحیح تقطي مجالات الصسمة وضبط الرض والتکاثر. ویستفسر مطور الاختبار 
عما اذا كانت درجة كلية واحدة أفضل pi‏ درجات الجالات الفرعیة؟ 


== 9 









































ه- طبق اختبار القبول لكلية دولية في فصل الربيع وبصيغ مختلفة استخدمت في 
موقفين. ويريد المشرفين في الكلية على اختبار القبول ادلة تؤشر على أن وقت التقدم 
للاختبار لا يؤثر في نتيجة الاختبار. 





(i‏ افترض أن الباحث يريد تقييم الاتساق الداخلي للاختبار باستخدام التجزئة النصفية. 
وذلك بتقسيم الاختبار إلى اختبارين فرعيين أحدهما بالفقرات الفردية والآخر بالفقرات 
الزوجية. احسب الدرجات التي حصل عليها كل مفحوص بهذه AB‏ . . 

ب) احسب معامل الارتباط بين هذين الاختبارين الفرعيين. 

ج) ما تقدير الثبات للاختبار الكلي. 

د) بالاعتماد على الفحص البصري» هل تتوقع أن طريقة التجزئة باستخدام النصفين الأول 
والاخیر للاختيار ينتج عنه تقدير أعلى للثبات أم أقل من ذلك الناتج عن التجزئة الفردية 
- الزوجية؟ 

ه) أي طريقة للتجزئة ينتج عنها تقدير أكثر دقة لمعامل الدقة؟ عدل استجابتك. 














" و) ما قيمة معامل كيودر-ريتشاردسون 20 لهذا الاختبار؟ ومعامل كيودر-ريتشاردسون 21؟ 
5( فسر الاختلاف بين قيمتى KR20‏ و SKR21‏ 


3 يتضمن الجدول الآتي بيانات وصفية لاختبارين فرعيين لبطارية اختبارات معيارية, 
والذي is‏ تضمن صیفتین بديلتين. تفخحصس oda‏ البیانات وأجب عن الأسئلة التالية: 





(i‏ ما الأخطاء المعيارية للقياس لكلا الصیفتین؟ وهل الأفضل استخدام صيفة الاختبار 
ذات الخطأ المعياري الأقل؟ 

ب) إذا حصل توم على الدرجة 20 في اختبار الحسابات الرياضية على الصيغة أ, سس 
فترة تتضمن درجته الحقيقية وينسبة ثقة %68 . ما هی حدود هذه الفترة المحتملة لو 
أردنا أن تصبح نسبة الثقة %95 . 

د) فكر ناشر الاختبار في تقصير اختبار حل المشكلات الرياضية لتصبح خمس فقرات 

ه) في دراسة الثبات لم يكن الوقت کافیاً لإكمال اختبار حل المشكلات من قبل جميع 
الطلبة, ما الأثر المحتمل لهذا على قيمة KR20‏ 


سیب 1 == 
































و) افترض أن ناشر الاختبار دون BLE!‏ بقيمة (80.) بين اختبارين فرعيين من الصيغة | 
درجات هذين الاختبارين فى تحديد الطلية الذين قد يستفيدوا من التعليم الإضافي 
لحقائق الرياضيات الأساسية. واقترح الاستان فحص الفجوة بين درجتى 2 لكل من 
(الفجوة) سالب ويقيمة كبيرة تم إعطاءهم تعليم خاص. أي الصيغتين تؤدي إلى نتائج 
ثياتها أكير؟ وما تقدير الثيات المترتب على فروق الدرجات هذه؟ 


4 للاختبارات الموصوفة في الفقرة السابقة. يتضمن دليل الاختبار الجداول الآتية 
لبیانات الارتباطية. وبعد تطبيق الاختبار سال عدة معلمين الشرف على الاختبار عن 
المعاملات التى يهتمون بها. أشر إلى أي المعاملات في المصفوفة تتضمن معلومات 
ise:‏ لشو ا اماب كل ما 





أ) اقترح جوين ليف فصله بيوم لجازة وسألت إن كان ممكناً تطبيق الاختبار نفسه 
لطلبتها في اليوم التالي. 
ب) قال السيد روبنسون أنه يتوقع أن الصيغة ب تتضمن أسئلة كثيرة تعتمد على محتوى 




















لم يغطيه الكتاب القرر الذي يدرسه. وأن الصيغة الأخرى أنسب للمنهج الذي 
پدرسه. 

ج) شعر السید بارکر أن الاختبار أعطي في وقت مبكرء واقترح تأخیر الاختبار Baal‏ 
أيام» إن سیکون Laie‏ آداء عدة مقحوصین مختلفاً بشكل آساسي. 

د) يرغب مستر july‏ جمع درجات اختباري الریاضیات في مركب واحد لانه یعتقد آنهما 
یقیسان الشیء نفسه. 

و) دون دلیل اختبار في الشخصية ثبات التجزئة النصفية محسوياً بالصيغة: 

۸ A 


Pxx* 
A 
Ox 


حيث تمثل © و H‏ درجات نصفي الاختبار أثبت أن هذه الصيغة تكافيء معامل رولون. 

6 ابتداءً بصيغة KR20‏ المبينة في هذا الفصلء اشتق KR21‏ مع كتابة أي افتراض 
يلزمك في عملية الاشتقاق. 

7 قارن بين طرائق التجزئة النصفية والتباين الشترك للفقرات الختلفة المستخدمة في 
سای الات glide‏ رشن فاد کک ع ات مه پیش 
هذه الطرائق. 
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الفصل الثامن 
مدخل الى نظرية التعميم 

تعد الطرائق القدمة فی الفصل السابع تقتیات فعالة فن دراسة الثبات الا آنها لیست 
بالرونة TALI‏ اتتناسب مع مشکلات القبات جمیعها التي تظهر في الاختبارات العفلية. 
افترض مثلاً أن (50) طالباً کتبوا مقالات صححت على تدریج مولف من )10( نقاط بوساطة 
BE‏ مصححین, ولأن التقنیات البينة في الفصلین )7,6( تستخدم في حالة توافر قياسين لكل 
مفحوص, لذلك فانه لا يمكن تطبیقها مباشرة قي هذا الوقف. ومثال pT‏ استخدم معلل 
نفسي يعمل مع الأطفال من ذوي الاحتیاجات الخاصة صيغتين متبادلتین لاختبار تشخيصي, 
واهتمامه منصب إلى الحد الذي تعطي فيه نتيجة الصيغتين الدرجة نفسها لكل طفل فضلاً 
عن انحراف الدرجات عن وسطها حتی یصل إلى صيغتين متوازيتين تماماً. ومن خلال 
النظرية التقليدية فان كلاً من معامل الثبات والخطاً العياري قد تعطي نتائج مضللة عندما 
تطبق في هذا الوقف وعندما يتم حسابهما لاختبارین ليسا متوازیین تماماً فإن معامل الثبات 
والخطأ العياري للقیاس يقيسان اتساق الدرجات الزائية وانحراف الدرجات. ومثال أخيرء تم 


توزیع اتجاهات السترشدین في برنامج إعادة تأهیل الدمنین إلى مجموعتين ارشادیتین . 


مختلفتین من خلال أريعة مرشدین. ويفيد هنا معرفة مساهمة کل من التباین عبر المرشدين 
والتباین بين الجموعتین في التباین الخطاء ثانية فان نظرية القیاس التقليدية تزودنا بعنصر 
خطأ غير مميز لا یمکن تطبیقه بسهولة في هذه الشکلة. 

آحد الأسالیب الثمرة فى حساب معاملات الثبات وتباین الخطاً فى مثل هذه الواقف 
تعتمه على تطیل التباین. فاستخدام فحلیل التباین في حساب معاملات الكدات واخطاه 
القیاس له تاريخ یعود إلى الأريعينات من القرن السابق. فمعظم الصیغ الاساسية وضعت من 
قبل بعض الولفین أو آنها واضحة من خلال آعمالهم. مثل هويت )1951 (Hoyt,‏ ولیندکویست 
(Lindquist, 1953)‏ وليندي ومیتزل )1963 (Medley& Mitzel,‏ وقد نشر کل من کرونباخ وجلیسر 
وراجساراتنام )1963 (Cronbach, Gleser & Rajaratnam,‏ آول بحث لهم في نظرية إمكانية 


التعميم. وكانت الساهمة الرئيسة لهذه الدراسات ليست تطوير صيغ جديدة للثبات وٍنا تطوير 


طريقة للتفكير في الثبات. و/آو تباين الخطأ الأكثر ملائمة للموقف الذي سنتناوله. 





J RI: 





لهات دات ل fies‏ و موا لوقه E‏ ی کا و 
(1972). ومصدر آخر AST‏ شمولية من هذا الفصل ولکنها ادل شمولية و ا من کرونباخ 
وزملاه تجدها فى بربنان )1983 (Brenan,‏ 

D ودراسات‎ G دراسات‎ 


من الضروري عند بدء دراسة نظرية |مكانية التعمیم التمييز بين دراسات إمكانية التعمیم 
(G)‏ ودراسات القرار (). فالباحت الذي يجري دراسة © يهتم بصورة آولية بمدی التعمیم 
من عينة القیاس إلى نطاقه. ويحدد النطاق Sule‏ من خلال مجموعة شروط القیاس الاکثر 
شمولاً من الشروط التي تم فیها القیاس. ویمکن اعتبار الدراسات التي تهتم باستقرار 
الاستجابات عبر الزمن» وتکاف درجات صيغتين أو أكثر للأداة نفسها أو العلاقات الداخلية 
Ga‏ رات teal metal‏ وزاننات 6 وس ی E Stivers)‏ از در 
البیانات لولف معي من اجل SLES!‏ قران فهی د اتات تمك التسوصين من الجل 
الاختیار أو التسکین أو مقارنة الجموعات في تجرية أو اختبار علاقة بين متغیرین أو آکثر. 

وتستهدف دراسة G‏ في الساعدة في التخطیط لدراسة D‏ التي لها إمكانية تعمیم ملائمة. 
لذا فإن تصمیم دراسة 6 تحتاج المشاركة التامة في التصمیمات التي يمكن استخدامها 
لدراسة D‏ ولا يمكن تصنیف الدراسة على آنها دراسة 6 أو D‏ اعتماداً على تصمیمها فقط 
فهدف القاحص هو العامل الحدد: افترض أن باحث آجری اختباراً على 2000 طفل اختیروا 
عشوائياً من الدارس العامة و 2000 طفل آخرین اختیروا عشوائياً من الدارس الخاصة في 
النطقة نفسها باستخدام اختبار تحصيلي مقنن واحد. فإذا كان هدف الباحث تحدید ما إذا 
كان الاختبار له الثبات نفسه, لكلا الجموعتین فیمکن تصنيف الدراسة على آنها G‏ وآما إن 
كان هدفه مقارنة متوسط مستویات تحصیل المجمموعتين لعمل استنتاجات حول ملائمة 
النظام التربوي لکلا النظامین تصنف الدراسة على آنها ظ. کمبداً على الفاحص أن يؤسس 
طريقة قياس قستخلص منها بیانات قابلة للتعمیم قبل الشروع في دراسة D‏ مان شیک 
اختبار امكانية تعمیم البیانات آحیاناً باستضدام بیانات دراسة D‏ ولکن يجب الفاء 
الاختصارات في السلوکات البحثية كلما آمکن ذلك. 

وفي نظرية إمكانية التعميم تسمی شروط القیاس آبعاد Skies (Facets)‏ افترض أنه تم 
تدریج آداء عمال مصنع من خلال مشرفين آثنین وضمن عبء عمل: ثقیل» ووسط وخفیف. 
هنا شروط القیاس (الأبعاد) التي أخذت فیها القیاسات هي الاشراف وعبء العمل. توضیح 
آخر: آجری باحث قياس للكتابة الانشائية للاطفال في أربعة مناسبات. كتب کل طفل الانشاء 
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في موضوعين مختلفین» في كل مناسبةء وتم تصحيح المواضيع من قبل GIG‏ مصححين. هنا 
استخدم التصميم ثلاثة أبعاد هي: المناسبات والموضوع والمصحح. 

ويمكن معالجة البعد في دراسة D‏ على أنه ثابت sf‏ عشوائي» فعندما يهدق الباحث 
التعميم إلى الظروف التي تظهر فيها دراسة D‏ فقط فان البعد يكون ثابتاً. آما عندما يأخذ 
الیاحث شروط دراسة D‏ على أنها dine‏ من عدد كبير من الشروط ويهدف التعميم إلى 
الشروط الأخرى كافة فإن البعد يكون عشوائياً. وفي كلا الحالتين يطلق على القياسات التي 
تم الحصول علیها تحت شروط القیاس جميعها اسم نطاق التعميم (Universe of‏ 
generalization)‏ وفي دراسة Lat G‏ يجري القیاس ضمن مجموعة لشروط محددة. والتي 
تؤخذ que‏ الاعتبار لتمثل مجموعة آکبر من الشروط. ویسمی مجتمع اللاحظات التي تتضمن 
شراط dled‏ عنس دوا مان SU‏ الموج عا رنه نکن فان پرانته تشه 
للباحث الذي يخطط لدراسة D‏ فقط في حالة کون نطاق الملاحظات السموح یتضمن نطاق 
إمكانية التعميم. : 

تعرف الدرجة الحقيقية في نظرية القياس التقليدية على أنها متوسط درجة عدد كبير من 
الاختتارات القواؤية افا ماما تياين الدرجة الحقيتية فين سايق هذه التوسطات نمیا 
ويعرف الثبات على أنه نسبة تباين الدرجات الحقيقية إلى تباين الدرجات الملاحظة. وأما في 


نظرية إمكانية التعميم فإن درجة المفحوص الشاملة تعرف بأنها متوسط القياسات في ظا ` 


التعمیم. ولا یفترض أن تکون هذه القياسنات مشاه تایب وإحدى طرق تعريف معامل 
إمكانية التعمیم على أنه نسبة تباین الدرجة الشاملة إلى تباین الدرجة اللاحظة آلتوقع» وهذا 
الأخیر یعتمد على تصمیم دراسة JED‏ فانه يوجد معاملات إمكانية تعمیم مختلفة تناسپ 
تصمیمات دراسات D‏ الختلفة (تعریف آخر لعامل إمكانية التعمیم: هو أنه مریم معامل 
الارتباط بين درجات النطاق والدرجات اللاحظة» وسيؤجل مناقشة هذا النوع من معاملات 
التعمیم إلى آخر الفصل). أيضا تعتمد درجة النطاق وپالتالي تباینها على نطاق التعمیم. لذلك 
عندما يريد باحثين أثنين استخدام تصمیم دراسة D‏ نفسه ولکن لنطاقات تعمیم مختلفة فهذا 

وفي الجزء التالي سیتم وصف كيفية صياغة معاملات إمكانية التعمیم وحسایها لأربعة 
تیم انش hana‏ دات نع واه . ومع أن الكثير من تطبيقات نظرية إمكانية التعمیم 
تستخدم آبعاد عدة. ومن الأسهل فهم نظرية إمكانية التعمیم إذا رکزنا وله على دراسات 
تستخدم E‏ لخا فقط. وقي العرض التالي سنقدم مثال یستخدم تدریج سلوك لتوضیح 
صياغة معاملات إمكانية التعميم ومن ثم حسابهاء وفي هذا الموقف يكون «المقدرين» هو البعد 
الواحد. ومع ذلك يمكن تطبيق الطرائق ق الموصوفة في الأجزاء التالية على مواقف يتضمن يعد 
القياس فيها صيغة الاختبار والمواقف الاختبارية ومطبقي الاختبارات. 

















صياغة معاملات إمكانية التعميم للتصميمات أحادية البعد 

افترض أن عالم نفس اجتماعي مهتم في دراسة ارتباطات الحذرء وأجرى دراسة تم 
خلالها ملاحظة تلميذين أثنين في تفاعلهم في موقف اجتماعي. وهذه التجرية عبارة عن 
دراسة 9 كان أحد التلاميذ هو مركز الملاحظة والآخر كان يعمل مع alle‏ النفس دون ale‏ 
التلميذ الأول بذلك. هذا وسيتم تدريج مستوى الحذر على متصل مژلف من (10) نقاط. 
وخطط alle‏ النفس GY‏ يكون التلميذ مساعداً في تدريج متصل قياس مستوى الحذر» وحتى 
فى الموقف البسيط هذا هنالك عدة تصميمات محتملة لدراسة D‏ أريعة منها تكون على النحو 
الآتي: 

1 أعطي كل مفحوص درجة من قبل مقدر واحد. هو نفسه للمفحوصين جميعهم. 

2 أعطي كل مفحوص درجة من قبل مجموعة مقدرين» هم نفسهم للمفحوصين جميعاً. 

3/ أعطي كل مفحوص درجة من قبل مقدّر مختلفء ويوجد مقدر واحد لكل مفحوص. 

4/ أعطي كل مفحوص درجة من قبل مجموعة مقدرين» ويوجد مقدرين مختلفين لكل 

وفي التصميمات الأربعة جميعها يوجد sah‏ واحد للمقدرین, ففي التصميمات الأول 
والثاني تعرض كل مفحوص للمقدرين نفسه. أي آنهم تعرضوا إلى شروط قياس نفسهاء 
ويقال في مثل هذه الحالة أن البُعد تقاطع (Crossed)‏ مع المفحوصين. ويرمز لهذا التصميم ب 
۳ وترمز P‏ إلى الأفراد آو الفحوصین, وترمز 1 إلى شروط القیاس, ويطلق على البيانات 
الناجمة عن مثل هذا التصمیم اسم بیانات مزاوجة. ويتعرض كل مفحوص في التصميمين 
الأخيرين لقدرین مختلفین آو بصيفة أكثر عمومية تعرضوا لشروط قياس مختلفة» ویقال هنا 
أن شروط القیاس تداخلت “nested”‏ ضمن الفحوصین. ویرمز لهذا التصمیم “EDP” m‏ 
وتقرأ 1 تداخلت ضمن P‏ وفی مثالنا 1 تداخل القدرین ضمن المفحوصينء ویطلق على 
اليانات ct oa oN‏ اسب مات مسكظة italy‏ الضبيغة اللا عامل 
إمكانية التعميم على التصميم الذي يختاره الباحث عند تخطيطه لدراسة D‏ وكل معامل 
إمكانية تعميم عبارة عن نسبة تباين الدرجة الشاملة إلى تباين الدرجة الملاحظةء لذلك تختلف 
قيم معاملات التعميم المرتبطة بكل تصميم لاختلاف تباين الدرجات الملاحظة المرتبط بكل 
تصميم. ويعتمد حساب معاملات إمكانية التعميم الأربعة على تصميم دراسة G‏ وفي البداية 
سنتتاول cline‏ العامل الرتبط بتصمیم دراسة 0 )2( وسنست‌خدم في line‏ هذه 
العاملات تحلیل التباین ثنائي العامل وملاحظة واحدة في کل خلية, ویطلق على هذا النوع من 
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تحليل التباين أيضاً اسم تحليل التباين المتكرر. ويقدم شافيلسون (1981 Shavelson,‏ في 
الفصلين 16 , 17 شرحاً واضحاً لتحليل التباين» كما يقدم مايرز )1979 (Myers,‏ في الفصل 
السانس #وخديها ناسا تقدثيل التبايق المتكرن: 

وقبل أن نعود لناقشة نظرية إمكانية التعميم يجب ملاحظة أن تصميم 1, يمكن اعتباره 
حالة خاصة للتصميم 2: وذلك لأنه يستخدم مقدراً Vaal,‏ بدلاً من عدة مقدرین. كذلك فإن 
التصمیم 3 ومعامل |مكانية تعمیمه حالات خاصة التصمیم 4 ومعامل إمكانية تعمیمه» ومع 
ذلك سنحتفظ بعرض أريعة تصمیمات متميزة آثناء العرض. 


معامل إمكانية التعمیم للتصمیم 1: 

تذکر مثال عالم النفس الاجتماعي الذي يجري بحثاً یتطلب جمع تقدیرات عن الحذر 
(تقدیر الحذر). وافترض أن هذه Leal pall‏ ستجري في الفصل الدراسي القادم. وأن alle‏ 
النفس غير متاکد أي التلامیذ سیساعده في عملية التقدیر» وبصرف النظر فانه مهتم 
باستخدام بیانات دراسة G‏ لحساب إمكانية تعمیم التقدیرات التي يحصل علیها في دراسات 
D‏ مستقبلاً. من وجهة نظر نظرية إمكانية التعمیم فان موقف عالم النفس كما ياتي: 
للاعتبارات التطبيقية سيجري مقدّر daly‏ تدريج المفحوصين جميعاً في دراسة D‏ ون لم يكن 
Lage‏ من الناحية التطبيقية فإنه سيرتب المفحوصين بحيث يتم تقديرهم بوساطة عدد كن ڪا 
من المقدّرين المدربين» وهذا التجمع من القدرین يعد نطاق إمكانية التعمیم. وبما أن الباحث 
استخدم PP‏ واحداً فانه يود معرفة مدی جودة تعمیم التقدیر الذي آجراه مقدر واحد 
بالنسبة إلى متوسط التقديرات جميعها التي يؤشرها المقدرين جميعاً في نطاق إمكانية 
التعميم. 

وقبل عرض طريقة حساب معامل إمكانية تعميم المقدرين سنحدد عدة كميات. تمثل 1م26 
درجة الفحوص ‏ من قبل القدر i‏ وكما لوحظ في الفصل السادس فان الدرجة الملاحظة 
يمكن تصورها وأحدة من عدة تقديرات ممكنة التي حددها القدر 1 المفحوص Dp‏ لذلك فإن 
Xpi‏ تعد متغير عشوائى. وتمثل Tpi‏ المتوسط أو القيمة المتوقعة لهذا المتغير العشوائيء وهو 
الدرجة الحقيقية للمفحوص م عندما تم تقديره من قبل المقدر 1. ونموذج التقدير الملاحظ 
بيساطة هو: 

CSF anê E T = 


وهى نفسه في نظرية القياس التقليدية. والسؤال حول كيفية تعميم زم إلى Thi‏ هو 





Sennen ممما ا‎ om nee للحاو ري رود‎ apt Ramp ا سيوم ل‎ vate au 








السؤال الذي يطرح على ثبات زم وهذا ليس السؤال الذي يهم عالم النفس في الوقت 
«tal‏ وللتلميذ م تتغير Tpi‏ عبر القدرین» ومتوسط Tpi‏ عبر المقدرين هو الدرجة الشاملة 
للمفحوص P‏ وهذا المتوسط يرمز له بالرمز HP‏ وسؤال إمكانية التعميم لعالم النفس يتعلق 
بكم الجودة في التقدير في دراسة D‏ الذي سيعمم إلى UP‏ الدرجات الشاملة. كذلك نحتاج 
إلى تحديد ۸ (القيمة المتوقعة للدرجات الحقيقية للمفحوصين الذين تم تقديرهم من قبل المقدّر 
i‏ أي أن ا هي المتوسط عبر المفحوصين لہ Thy‏ وفي النظرية التقليدية تتساوى القيمة المتوقعة 
للدرجات الملاحظة مع القيمة المتوقعة للدرجات الحقيقية. كذلك في نظرية إمكانية التعميم 
تتساوى القيمة المتوقعة ل Xpj‏ (تقديرات المقدّر 1) والقيمة المتوقعة ل Tpi‏ (الدرجات الحقيقية 
للمفحوصين القدرة بوساطة القدر 1). كذلك نحتاج إلى تعريف ا التي ترمز للمتوسط عبر 
التلامیذ في درجات النطاق» Way‏ التوسط الاخیر مارب التوسط عبر القدرین Hi‏ والتي 
يشار إليها بالتوسط الاجمالي آو الکلي. ومن خلال هذه الرموز فان النموذج الخطي ل زر[ 


هو: 
BB eds epi + (n-p) + (u-up) + m = Xy‏ 
نصل إلى: 


epi شاج‎ + (p-up) = p-Xpj 

نلاحظ أن انحراف درجة الفحوص عن المتوسط الاجمالي مؤلف من BYE‏ عناصر: أثر 
المفحوص UP‏ - ۷ وأثر القدر pi‏ - ۰ والباقي -Epi‏ ويجب أن يلحظ القارئ اختلاف Cy‏ عن 
خطأ القياس Epi‏ في النظرية التقليديةء إذ أن زره يساوي Epi‏ إضافة إلى عنصر يعكس 
حقيقة أن الدرجات الحقيقية للمقدرين المختلفين ارتباطها غير تام. وخیرا يلزمنا تعريف 
عناصر تبأين عديدة: 

Up :تباين درجات المفحوصين الشاملة‎ opi 


Gals : o°?‏ متوسطات المقدرين. 
2 ما ۳ : 
Ge‏ 1 المتوسط عبر جميع المقدرين 6 


i للمقدر‎ Xi تباین‎ o 
وكيفية استخدام‎ G والآن بعد تحديد الرموز الضرورية دعنا نعيد النظر في دراسة‎ 
في الفصل الدراسي التالي.‎ 
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من قبل GIG‏ مقدرين» 
بوساطة مقدر جديد» فكيف يمكن استخدام هذه البيانات في حساب معامل إمكانية تعميم هذه 








افترض أن 


هدول 1-8: درجات المفحوصين العشرة موساطة ثلاثة مقدرين 





تذكر أن الثبات يحدد في النظرية التقليدية على أنه نسبة تباين الدرجة الحقيقية إلى تباين 
سا اللاحظة. وییدو منطقياً الآن تحديد معامل إمكانية تعميم التقديرات في دراسة D‏ على 
أنه: 

:0p2/o2,,‏ نسبة تباين الدرجة الشاملة إلى تباين الدرجة الملاحظة للمقدر المستخدم في 
واس D‏ وهنالك مشكلة تطبيقية مع هذا الاقتراح» وهو أن دراسة D‏ ستطبق في الفصل 
التاليء وعالم النفس لا يدري أي القدرين سيستخدم في دراسة LAID‏ إلى أن هذا المقدر 
قد لا يكون أحد المقدرين المستخدمين في دراسة 6. لذلك لا يمكننا باستخدام بيانات دراسة 
© حساب ره للمقدر الذي سيستخدم في دراسة D‏ 

















مع ذلك» إذا افترضنا أن المقدّر في دراسة D‏ ممثل بوساطة مجموعة المقدرين في نطاق 
التعمیم. فان أفضل تخمين لتباين متوسط (آو القيمة المتوقعة) La yall‏ الملاحظة (ي,02) 
للمقدرين الثلاثة فى النطاق» ويمكن تبيان أن متوسط الدرجة الملاحظة يساوى 002 + 062. 
اغنافة إلى ان بیانات القدرين الخلاكة Biles‏ من aaa 0 Lass‏ اشتخدامها لحشتان 
0,7 + 02. ونحصل على معامل |مكانية التعمیم بتعویض تباين الدرجة اللاحظة للمقدر 1 
بتباين الدرجة اللاحظة التوقع للمقدرین جميعاً في نطاق التعمیم. وکما يأتي: 

e see 57 

i + ۳ 

تستخدم الاشارة * في + ,2م لتشیر إلى أن العامل مناسباً لدراسة D‏ ضمن شروط 
التقاطع مع الفحوصین. لاحظ الافتراض الحرج في استخدام هذا العامل كما هو الحال 
للمعاملات الاخری القدمة في هذا الفصل, وهو أن القدرین في دراسة G‏ ودراسة D‏ یمثلون 
نطاق التعمیم نفسه. ویکون هذا ممكناً فیما لو تم تحدید القدرین في كلا من النطاق والعينة 
عشوائياً. وفي مثالنا هذا لیس ممكناًء لذلك فإن قضية کون القدرین عينة ممثلة تصبح مسالة 

وحالا يتم تحدید معامل [مكانية تعميم من خلال عناصر التباین يجب اقتراح طريقة عملية 
لتقدیر العامل, وهذا ممكناً باستخدام تحلیل التباین ثنائي العامل لبیانات جدول (1-8) والتي 
يمكن تصنیفها من خلال بُعدین هما: الفحوصین والقدرین (وکل منهما يعبر عنه بعامل في 
تحلیل التباین), وکل مقدر يؤلف أحد مستویات بعد القدر» وکل تجمع لفحوص ومقدر یسمی 
خلية. ویوصف التصمیم المبين في جدول )2-8( على أنه تصمیم ثنائي العامل بملاحظة واحدة 
في کل خلية لآنه يوجد درجة واحدة فقط لكل تجمع مفحوص-مقدر. 

ویمکن تلخیص نتائج تحلیل التباین ثنائي العامل بملاحظة واحدة في کل خلية في جدول 
dil‏ جدول (2-8), والاختصار ۷ 5 في هدا الجدول يدن مصدر القباين: والاختصار SS‏ 
يرمز لجموع الربعات. والرمز df‏ یمثل درجات الحرية. و MS‏ يرمز إلى متوسط الربعات. 
uty‏ من Baal‏ ان MS‏ كعمسي SS tes‏ علی 37 BGI‏ لها وشي كل من nip Mp‏ 
الی ase‏ الفحوصین وعدد القدرین علی التوالی فى دراسة .G‏ والجدول (3-8) ينين خلاصة 
حسابية لبیانات جدول (1-8). 5 
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جدول )2-8( الصيغ الحسابية ومتوسط الربعات المتوقع في تحليل التباين ثنائي العامل' 





Xpi T 2 X pi/ni Xpi => X pi Dp Xp z 22 X لثم‎ ninp 
i 


المريعات المتوقع (EMS)‏ لكل مصدر تباین في جدول تحليل التباين. وهذه الصيغ تحدد . 


العناصر النظرية للتباين التي تصاحب المربع المحسوب عددياً في جدول (3-8). وتحديداً فان 
كل EMS‏ تؤشر الصيفة المجتمع التي تقدر من خلال قيمة مريع المتوسط الناظر في جدول 
الخلاصة:؛ لذا فإن قيمة مربع التوسط المتوقع لعامل الأقراد EMSp‏ يحسب من مربع متوسط 
الافراد -MSp‏ والآن افترض أنك تريد حساب م0 من النتائج المبينة في جدول )3-8( 
وبالحدس يمكن رژية أن 1۷152 تقدر قیمتها من م62 فقط. ومع ذلك فان الصيغة في عمود 
5 تبين أن قيمة MSp‏ هی تقدير ل 06 + njO*p‏ وكذلك فان قيمة MSp‏ لا يمكن 
استخدامها کتقدیر لج0. وبالتمحيص المتعمق لصيغ EMS‏ الأخرى في الجدول تكشف أن 
۲ هي تقدیر ل 0% وحیث آن: 
njO?p + 0% = nip‏ -62 » ویمکن تعویض 02پ جیگ 


«<EMSr ws و م04‎ EMSp فر‎ 
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جدول (3-8): خلاصة جدول تحليل التباين 





EMS, _ EMS, = مر‎ 


وكذلك 
EMS, EMS,‏ 


n; 


وهذه الصيغة تبين أن عنصر التباين في صيغة EMS‏ يمكن عزلها وذلك بإيجاد مجاميع 
خطية موزونة لصيغتين آو أكثر من صيغ EMS‏ في جدول تحليل التباين. وحالما يتم تحديد 
التجمع المناسب فان الحسابات للعينة في عمود MS‏ تعوض في صيغة المجتمع لتقدير 
عناصر التباين ويتعويض عناصر EMS‏ بعناصر MS‏ نحصل علی: 
MS, _ MSP‏ 


Coe) ee ا‎ 


n, 


وبالتعويض العددي في جدول (3-8) في المعادلة )4-8( نحصل على: 
, 1.043-10.310 
er gee‏ نيلك 


وصيغة 0 بيساطة تساوي EMSr‏ ولذلك فان: 


= O2P 


(5R) ae MSr =02P 


۳۶ ba Lisa ۵62 کل من م02 و‎ alhas 1.043 = OP وفی مثالنا‎ 
Op? A 
مس رس‎ = P2, * 
A A 
Goo" Og 


== 225 
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وبالتعويض في المعادلة (6-8) نحصل على: 
: 3.089 


5 رب‎ 
ons 1.043 + وه30‎ Pi 





ومعادلة بديلة للتغبير عن ۳:2 من خلال عناصر MS‏ المختلفة هي: 


MS. MS A 
(4 - 8) دم‎ 9P = 02. « 


(n;-1)MS,+Ms, ° 





وبالتعويض في المعادلة )7-8( نحصل على 


,وه 1.043-10.310 


0.75 = ل سس‎ = i 
1.043 x(1-3)+ 10.310 


هذا ويجب أن تتفق نتائج تطبيق كلا المعادلتين )6-8( ,)7-8( ضمن حدود ALAN‏ 
والاختيار بين المعادلتين فو نوع من الملائمة الحسابية. ومعادلات مماثلة للمعادلة (7-8) التي 
تعبر عن معامل إمكانية التعميم على انه دال لقوسط الريعات تستخدم ايضباً في التصميمات 
)43.2( إلا أنها غير معروضة هنا OY‏ يفضل تقدير معامل إمكانية التعميم من خلال حساب 
عناصر التباين عدا عن شيوعها في أدبيات ومراجع القياس. 

D النفس أي المقدرين قام بعملية التقدير في دراسة‎ alle السابق لا يعرف‎ JAN a 
ات شین ان آنه عرف الآن المقدّر الذي أجرى عملية التقدير ويريد معرفة مدى جودة تعميم‎ 
ماذا يمكن أن تعمل‎ G وفي حالة وجود هذا القدر في دراسة‎ ALLAN التقدير للدرجات‎ 
إن هذا للعامل يمكن حسابه‎ GAEL لحساب معامل امكانية التعمیم التقديرا ات الخاصة بهذا‎ 
باعطاء هذا‎ D وکان آحدهم في دراسة‎ G فيما لو توافر على الأقل ثلاثة مقدرین في دراسة‎ 
هي:‎ G القدر رقم (1) فان معادلة حساب هذا المعامل بوجود ثلاثة مقدرين في دراسة‎ 

(8-8) rcs Goby + Morb) P(X: Hp) 


A A A À 


ووم و6 06 4 ; 5 
لاحظ أن المعادلة )8-8( تؤدي إلى تقدير مربع معامل الارتباط PX pi UP)‏ بين تدريج 
المقدر )1( والدرجات الشاملة. وقد اشتق لورد ونوفيك )268 ۳ ,1968 (Lord & Novick,‏ المعادلة 
8-8 والتی یمکن تطبیقها على آکثر من ثلاثة قیاسات. وپاستخدام جدول (2-8) نحصل على: 





+ 


Egg 








و [(0.914()1.264)2.573)+(2])0.790()2.043()2.57 
Up)‏ زو = سس سس 
p‏ 0.825)(2.043)(1.264)(6.620)4( 


0.90 = 


تذكر أن سم = 0.75 وبالتالي فإن معاملي إمكانية التعميم قدما انطباعين مختلفين 
لدراسة D‏ وهذه الفجوة بين المعاملين لأن ”م تشير إلى اختيار sade‏ عشوائياًء في حين أن 
(p 26۳, Up)‏ تشير إلى مقدّر محدد. وعند هذه النقطة يحتار القاريء في معرفة متى يكون 
معامل إمكانية التعميم المختار في الظروف العشوائية Jat‏ من المعامل المحدد بشروط 
مكمه ee EE ee re‏ اد ۱ 

Ho)‏ :يمكن خلاحظة آن معنامل الشنووظ العشوائية قد بکون of aS)‏ آصفر من معامل 
الشروط المخصصة. ويبدو أن کل من کرونباخ وجلیسر وراجاراتنام )1963( ولورد ونوقيك 
(1968) متفقين على أن معامل الشروط الخصصة أفضل من الآخر نظریاًء مع أن كرونباخ 
وزملاؤه اهتموا بدقة تقدير هذا المعامل والذي يتطلب fose‏ كبيراً من المقدرين في دراسة 6. 
وكنتيجة لهذا الاهتمام فإنهم فضلوا حساب معامل الشروط العشوائية. إلا أن لورد ونوشيك 
يميلان ألى تفضيل حساب معامل الشروط المخصصة. مع أن كلا الصدرین يقدمان صيغاً 
عامة لتقدير هذا المعامل. 


معامل إمكانية التعميم للتصميم الثاني: 

كان معامل إمكانية التعميم (75.) في الوقف الذي لم يعرف فيه الباحث أي المقدرين 
سيظهر في دراسة -D‏ ومع أن معامل إمكانية تعميم هذا المعامل أساسي إلا أن عالم النفس 
قد يكون مهتماً في العامل الذي ينتج فيما لو أشار مقدرين أثنين آو أكثر أن الدرجة هي 
المتوسط عبر المقدرين في دراسة D‏ وهنا يكون معامل إمكانية التعميم المناسب: 

o2 
Ch) are یت تسب‎ 
082/0 o2p 

ترمز nò‏ في العادلة إلى عدد القدرین الذین بشکل متوسط تقدیرآتهم ام daa‏ أن ny‏ 
شی کش المقدرين في دراسة 6 في حين أن 1 هي عدد المقدرين فى دراسة D‏ والفرق 
الرئيسي بين الصيغتين لكل من Pee‏ و :م هو أنه في الأخيرة تقسم Ge?‏ على عدد 


== 7 
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02 
0 یمه ........... )8 + 10) 

n ù/Ôe?* 62 

وثانية, Weitere ae‏ الاين من المعادلات )4-8 ,5-8( ووجدنا سابقاً أن م62 = 3.089 
pe 1.043 Oe? 3‏ الآن أن ae‏ النفس ee‏ مقدرين أثنين ره = 2 في دراسة (1. 

095 ۲ 

2/1.043 + 3.089 

نجد أن زيادة عدد المقدرين إلى 2 يزيد معامل إمكانية التعميم من )75. إلى 85.). كذلك 
tne‏ ليم مه للمقدرين ny‏ ا مناسب من 
MS, MS,‏ 


Pig,‏ _——— و 
my MSr (n; -:( + MSp‏ 
وبالتعویض في المعادلة 11-8 ينتج: 
10.310 - 1.043 
=p? 4‏ سم = 0.86 
i 2/(1.043) (2-3) + 10.310‏ 
وعندما تكون Ny = Ny‏ فإنه يمكن تيسيط المادلة )11-8( لتصبح: 
رم Mst MY‏ م CE‏ 


MSp P” 
و‎ Dis وهذه الصيغة واسعة الإنتشار في الأبحاث التعلقة بالوضوع. وعرضياً نلاحظ أن‎ 
زم تربط بينهما علاقة (نبوءة) سبيرمان- براون» وكما يأتي:‎ 


nò pe =p? 





n) +1‏ -1) 2م 





مر زار 


` agy 








وكما في التصميم الأولء هنالك معامل آخر يكون مناسباً في حالة کون المقدرين في 
دراسة D‏ كانوا من ضمن المقدرين في دراسة G‏ ويرمز لهذا المعامل ب (Kpy , Up)‏ 2م الذي 
العادلة )8-8( لحساب (Xp) , Hp)‏ 2م. وپاستخدام المعادلة )8-8( في هذا الموقف فان متوسط 
درجات الفحوص فی دراسة G‏ المعطاة من قبل القدرین الذین ظهروا فى دراسة D‏ تحسب 

۸ A 7 x ۱ 

.. لكل مفحوص. وهنا يرمز Of‏ إلى الانحراف العياري للدرجات. والرموز Pir‏ , ورم تشیر إلى 
الارتباط بين هذه الدرجات والدرجات الُعطاة من قبل المقدرين الأثنين في دراسة 0 الذين لم 
یظهروا فی دراسة ظ. 


معامل إمكانية التعمیم للتصمیم الثالت: 

افترض أن ملاحظة وإعطاء الدرجات لكل مفحوص في التجربة استغرق وقتاً طويلاًء ولکن 
عند توافر عدد كبير من المساعدين الذين يمكن استخدامهم کمقدرین» وهنا قد يستخدم alle‏ 
النفس مقدرين مختلفين لتقدير كل مفحوص: تذكر أن المقدرين في هذه الحالة تداخلوا مع 
المفحوصين. دعنا الآن GAG‏ تباين الفحوصین عبر المقدرين بعين الاعتبار» وحيث أن كل 
مفحوص قدر من قبل مقدر مختلف فإن الفروق عبر المفحوصين SUG‏ بالفروق عبر المقدرين 


كما تتأثر بتباين فروق درجة النطاق والبواقي, ونتيجة هذا فان تباين الدرجة الملاحظة في 


التصميم 3 يكون 02+ :062+02. ويعكس الحد ,02 الفروق عبر المقدرين. ومعامل إمكانية 
للتعميم للتصميم 3 يكون: 

o 2‏ ی 
oe2+ 62, +02p ۱‏ 
لإعطاء إشارة استخدام ,”م في حالة تداخل ١‏ في P‏ فان 1 في ”م لم يؤشر لها باشارة 


p% 


Ed 


ويستخدم حساب Pp,‏ في تصميم 3 لدراسة G‏ تقديرات 05 Ory‏ ويالمعادلات )4-8( ق 
)5-8( علی التوالي» اضافة إلى نلله یلزم تقدیر OF‏ (وکما سنری في تصمیم 4 لدراسة 6 
فإن تقدير 0 is‏ يتطلب تقدير منفصل للكمية (0e?+02;)‏ ويمكن اشتقاق ;0 Rawls‏ ستخدام EMS‏ 
فى جدول 3-8 وعلی النحو E‏ 


== 9 
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EMSr_ EMSi 
np 
: كذلك فإن :02 تقدر ب‎ 





4 


(14 - 8) ی‎ DENM ی‎ 
1 np 

1.043 - 4.933 Ao 

م6 = 





i 


0.389 = i 
10 
2 
115 eee oF 


يد نس 
be2+ 62.46%) = Pi‏ 


وهذا يؤدي في مثالنا إلى: 
3.089 


ae E 
1.043 + 0.389+3.089 =P% 


من مقارنة معامل إمكانية التعميم للتصميم )3( )68( مع معامل امكانية التعميم للتصميم 
(1) (0.75) نجد انخفاضا في التعميم. مع ذلك فإن الإنخفاض ليس كبيراً. من هنا نقترح أنه 
فى حالة إمكانية تطبيق التصميم )3( يمكن اعتيارةٌ تصميماً منطقياً لتجرية alle‏ النفس. وكما 

هو الحال مع معاملات إمكانية التعميم الأخرى توجد صيغة لتقدير :2 مباشرة من MS‏ 
MS, MS,‏ 


meenamen ae A 1 
p+ ni MSi/ny+ MSp-a(n;np n; n) MSr/ > Pi 


ومن الهم تمییز آن ثم معامل مناسب لتصميم دراسة D‏ التداخلة» ويمكن حسابه 
باستخدام بیانات تصمیم دراسة G‏ التقاطعة. وهذا يوضح أن دراسة G‏ الصممة تصمیما 
جيداً تسمع بحساب معامل إمكانية التعميم الذي برافقها لدی واسع من تصمیمات دراسة 
.D‏ ومقارنة معاملات امكانية التعمیم لتصمیمات عديدة تسمح للباحث مقارنة ومقابلة 
تصمیمات دراسة D‏ من خلال |مكانية تعمیمها واختیار تصمیم دراسة D‏ المکن تطبیقه 
ویتسم بامكانية تعميم مناسبة. ۱ 











معامل إمكانية التعميم للتصميم الرابع: 
افترض أنه كان بالإمكان تقدير كل مفحوص من قبل مقدرين مختلفين في دراسة D‏ ولكن 
بريد عالم النفس مقدرين أثنين أو أكثر لكل مفحوص. معامل إمكانية التعميم المناسب لهذا 
التصميم يكون: 
O p? A‏ 


(AT - B) eax e ee Ae 
(ce2+ o; ng +02p 


المعادلة )17-8( مع المعادلة )13-8( نرى أن الحد :02 Ge2+‏ مقسوماً على 1 فى المعادلة 
)17-8( لذا فان استخدام عدد مضاعف من المقدرين يقلل من أثر تباین المقدرين وتباين 
البواقي في تباين الدرجة الملاحظة ويزيد من معامل إمكانية التعميم. الصيغة لىم هی: 
2 
۵2 بت شش مت do‏ )8 - 18( 
oe? yn! +02p‏ +;02( 
ولقدرين آثنین» ينتج عن هذه المعادلة: 
فو تست ۱ نيياك ۳8 
9 +(0389 + 2/(1.043 


gua‏ (4-8): معاملات إمكانية التعمیم لتصمیمات دراسة D‏ الأردعة للبعد الواجد 


التصميم الوصف ate‏ شروط القیاس تباین الدرچة الملاحظ ۱ معامل امكانية التعمیم 
2 

2 E E op + oe? 1 Pxi 1 

PL (op oe?) 
op? 2 

Qe n,Voe + op nj. : Pxj 2 

Pt n;1/ oe2 top? 
2 
Oe A A oe” + Oi + Op 1 Pj 3 
oe2 + برد‎ Op? 5 
p7 op? V(oe2 +o2i)+ o2 4 
L nV(oe4 to4i)+ Op 2: Pj 


ny (oe +i) top2 


== 1 




















ولثالنا هذاء يوجد صيغة لتقدير ,75 مباشرة من متوسط المريعات: 
MS, 5‏ 


ata pn Dee 
ج‎ 0 





nytt, / MSe (n; - npr, - np n;)+n, MS, /npna+ MSp 


ملخص معاملات إمكانية التعميم للتصميمات الأريعة: 
تباين الدرجة الملاحظة ومعاملات إمكانية التعميم للتصميمات الأربعة. ونعود لنؤكد على حقيقة 
ايلات ee‏ كمه . ويمكن حساب المعاملات 


دراسة © لبعد واحد متداخل (التصميم الرابع): 

من الممكن إجراء دراسة G‏ بتصميم 4 إذ يمكن قياس كل مفحوص ضمن شروط مختلفة 
عن الآخرين. ففي مثال التقدير يظهر تصميم 4 فيما لو تم تقدير كل مفحوص من قبل 
مجموعة مقدرين مختلفين. ويمكن استخدام دراسة G‏ التي تعتمد تصميم 4 فقط لحساب 
معاملات إمكانية التعميم للدراسات التي تجري باستخدام التصميمات 3 و 4. ونتيجة لذلك 
فإن دراسات D‏ مثل هذه تميل GY‏ تكون ذات قيمة أقل من تلك التي تجري بالتصميم 2. 
علاوة على أن دراسة © التي تجري بالتصميم 4 تتطلب صيغاً جديدة لتقدير هذه المعاملات 
وعندما تجمع بيانات دراسة © باستخدام تصميم 4 فان صيغ حساب P3‏ و PY‏ تعتمد على 
تحليل التباين الأحادی؛ والعامل الوحيد هو المفحوصين. وتعالج تقديرات المفنحوصين على 
أنها قياسات متكررة على المفحوصين. ويبين جدول )5-8( الصيغ اللازمة لحساب تحليل 


جدول (5-8): الصيغ الحسايية ومريعات المتوسطات المتوقعة لتحليل التباين الأحادي: 


EMS MS df SS SV 
n; 020 +02. +20 o(np-1)/ م55‎ 1-۳ Xp -XK الفحوصين‎ 
p 
07; +07, [(1-n)np]/ssr apop Xp - X البواقي‎ 
۱ ip 


لس 232 
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ninp/ Xpi کک‎ = Xp n;/ Xas = Xp 


الاكورة تم الحصول علیها بتطبیق الصیغ التاسبة على بیانات جدول )2-8( وهولجت منا 
MS. _ MS‏ 
=p‏ کی نب E 2 Since:‏ 


n; 


) eS) م‎ MS, = etOi و‎ 


وفي مثالناء ينتج عن هذه الصيغ: 


pace ae oie, 


و 071+,0% ے 1.432 


ويمكن حساب العاملات Pi?‏ و Py?‏ باستخدام المعادلتين )15-8( و )18-8( على التوالي: 
جدول (6-8): خلاصة جدول تحليل التباين 





النطاقات والأبعاد التایتة: 

في الأمثلة السابقة جميعها أهتم الباحث في التعميم على نطاق يتضمن شروط قياس غير 
تلك المستخدمة في دراسة D‏ ففي هذه الأمثلة كان بُعد القياس بُعداً عشوائياًء وافترض أن 
الاد اه تین فا رن ریا القباسن ف باه UND‏ عينة عسوائية من 
الشروط الاکثر شمولاً والتي تؤلف نطاق التعمیم. وفي أمثلة آخری يرغب الباحث التعمیم على 
نطاق یتضمن فقط الشروط التي تظهر في دراسة D‏ وفي هذه الواقف یکون بعد القیاس 
LLG‏ وهذا الجزء یهتم بنظرية امكانية التعمیم فنطاقانت ذات sles)‏ ثابتةء وتوفشت درأشات D‏ 
التي تستخدم التصمیم )1 و 2)» إذ يبدو آنها ASU‏ شيوعاً. ومع ذلك يمكن اشتقاق نتائج 
مشابهة التصمیمات (3 و 4). 
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etary مسيم ی ييه بايا‎ eeu می أن‎ a tee sae 


معامل إمكانية تعميم التصميم 1/ دراسة an D‏ ثابت: 
استرجع تطوير النموذج الخطي ل زم لرؤية مضامين معالجة البعد على أنه ثابت أو 
عشوائي. وقد أشرنا إلى أنه یمکن تصور زوک علی آنها احدی التقدیرات التي [عطاها القدر 


i ۱‏ للمفحوص P‏ لذلك فان زم تكون متغير عشوائي للمفحوص ‏ والقدر i‏ ويرمز المتوسط أو. 


القيمة التوقعة ل Xpj‏ بالرمز Thi‏ وعرفناها على آنها متوسط Tpi‏ عبر القدرین. 


افترض الآن وجود فاحصين أثنين حصلوا على بیانات من تصمیم یم 1/ دراسة D‏ تذکر آنه 
يستخدم مقدر واحد في هذا التصميم «المقدر «d‏ ويجري Laas‏ للمفحوصين جميعاً. 


والفاحص الأول تصور المقدر 1 على أنه ممثل لنطاق أكير من المقدرين» أي أنه عد المقدرين . 


بعد عشوائي ويريد معرفة مدى جودة تعميم Xpj‏ على ‘Up‏ درجة النطاق للمفحوص P‏ في 
Op?‏ ۱ 
oe2+ op?‏ 


=n 
= p* 


والفاحص الثاني لم يكن مهتماً بالتعميم إلى نطاق مؤلف من مقدرين عدة» عدا عن كونه 


نطاق تعمیمه مژلفاً من مقدر واحد. وكنتيجة فان الفاحص مهتم بمدی جودة تعمیم Xpj‏ على . 


1 أي على درجة نطاق الفحوص القدرة من قبل القدر 1ء وهنا یکون تباين درجة النطاق هو 
تباین Xpj‏ ويرمن له ب يم ج02 . ونتيجة لذلك فان معامل إمكانية التعميم الثاني يكون 
م 0/ Oph‏ : أي نسبة تباين الدرجة الحقيقية إلى تباين الدرجة الملاحظة للمقدر od‏ وهذا 
يكافيء معامل الثبات التقليدي للمقدر الواحد. ونقطة مفتاحية- دليلية- هو أن تعريفات درجة 
النطاق ومعامل إمكانية التعميم تكون نفسها للأبعاد الثابتة والعشوائية. وحتى عند استخدام 
التصميم نفسه لدراسة D‏ فإن تغيير البعد من عشوائي إلى ثابت يغير حدود النطاق وبالتالي 
يغير درجة التطاق. وتباينها ومعامل إمكانية تعميمها. ' 

كذلك يمكن تحديد المعامل المناسب لتصميم 1/ دراسة D‏ ببعد ثابت, والسؤال المهم هو ما 
إذا كان بالإمكان تقديره من البيانات المجمعة في دراسة -G‏ والإجابة أنه لا يمكن حسابه ولكن 
يمكن تقدير الحد الأدنى والذي يتم باستخدام بيانات دراسة /G‏ تصميم 2»والذي يظهر فيها 
المقدر بکل من دراسة 0 ودراسة .ومع هذا المقدر المشترك يمكن حساب jj‏ 02 بسهولة 
وذلك بحساب تباين التقديرات ز/,02التي Lasia‏ المقدّر الشترك. ومع ذلك لا نستطيع في العادة 





as Seaway eerie Aa WIN ل صمت ی اراسي‎ em, مس‎ panes 


pii‏ لين 








fe} 2‏ 
حسساب 0*7 ولكن الحد الأدنى لہ م ,102 روش (Lord & No 5 gpl‏ 


xf” 
و زر +652 مكان م 0 والكمية‎ Oe? مكان‎ Oe? وحسب هذا المعامل بتعويض‎ vick, 1968) 
وللمقدر 1 في جدول‎ G والتي تحسب من تحلیل التباين الثنائي لبيانات دراسة‎ MSr = Oe? 
1.043 


1-8) فان ا -l‏ — = 84 
(1-8) فإن المعامل يكون ETT]‏ 084 


معامل إمكانية تعميم التصميم 2/ دراسة (1 ببعد ثابت 

Gt‏ الی ate ait‏ اسستخدام تصمیم 1 D Leda ES‏ وییعه ثابت يكو معامل امان 
التعمیم الناسب مكافئاً لعامل الثبات في النظرية التقليدية. وبصورة مشابهة فعند استخدام 
میم 2 ی اه يزاسة D‏ وعد شتا كانت فان ال ایکا التعديم Tiaa‏ 
يكافيء معامل الثبات في النظرية التقليدية. وفي التصميم 2 فان الدرجة الملاحظة هي متوسط 
الدرجات التي حصل عليها الفحوص, لذا فان المشكلة تكمن في حساب ثبات الدرجة المركبة. 
وكما لوحظ في الفصل السابع اعتبر معامل ثبات » الحد الأدنى لعامل الثبات ثل هذا 
المركبء مع العلم Gb‏ المقدرين الذين ظهروا في دراسة D‏ هم فقط المقدرين في دراسة 6. 
ويمكن اعتبار معامل ثبات » الحسوب في دراسة G‏ هو الحد الأدنى لمعامل إمكانية التعميم 
الا 


استخدام نظرية إمكانية التعميم مع بيانات غير التقديرات: 
يجب أن يكون واضحاً من هذا العرض أنه يمكن تطبيق نظرية إمكانية التعميم بشكل مفيد 
فى بيانات التقدير. ومع ذلك فإنه يمكن تطنیقها على بيانات من آنواع أخرى من الفقرات 
والاختبارات الأقل وضوحاً. في المثال الأول افترض أن لدينا ثلاثة صيغ بديلة لاختبار 
تحصيلي معياريء ويما أنه یمکن بناء صيغ آخری للاختبار نفسه فمن النطقي تصور هذه 
الصيغ على أنها عينة ممثلة للصيغ المحتملة الممكن بناؤها. والآن افترض أن دراسة فى إحدى 
المقاطعات تستخدم صيغة واحدة من الثلاث في دراسة -D‏ ومن المهم معرفة مدى جودة تعميم 
درجات هذه الصيغة على نطاق الدرجات لصيغ الاختبار الممكن بناژها جميعاً. في هذه الحالة 
gl‏ معامل إمكانية التعميم الأنسب هو P(X pi , Mp)‏ ولحساب هذا المعامل يجب أن تجري 
المقاطعة دراسة G‏ باستخدام الصيغ الثلاث. واستخدام المعادلة (8-8) لحساب معامل 
إمكانية التعميم. وكمثال ثاني: افترض أن عالم نفسي خطط لدراسة العوامل المرتبطة بالشعور 
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بالذات» والدراسة المخطط لها هي دراسة D‏ وطوّر الباحث أداة مؤلفة من 20 فقرة صح/رخطأ 
وخطط لتطبيقها على المفحوصين جميعهم في دراسة D‏ وتصور الفقرات هنا على أنها عينة 
عشوائية من نطاق الفقرات الممكن استخدامهاء ولاحظ أن الباحث يمكنه تسجيل درجات 
الفقرة للمفحوصين جميعهم في دراسة (1 في جدول مشابه للجدول (1-8) فالصفوف في 
الجدول لازالت تشير إلى المفحوصين ولكن الأعمدة تشير إلى الفقرات, لذا فإنه يمكن تصور 
تصميم دراسة D‏ على أنه تصميم 2 ويفقرات تمثل مقياس البعد. وحيث أن الدراسة ستجري 
بتصميم 2 فإن معامل إمكانية التعميم المناسب يكون ”م والسؤال الذي يظهر هو: ما نوع 
دراسة G‏ التي يجب أن يجريها الباحث لحساب م*م. وتذكر أنه لزم في مثال التقدير 
التصميم 2 لحساب P e‏ وبصورة مناسبة ففي المثال الحالي يلزمنا دراسة G‏ بتصميم 2 
لذا فإنه يمكن للباحث أن يطبق الاداة على مفحوصين عددهم TIP‏ ویستخرج منها استجابات 
جدول myx ny‏ مشابه لجدول )1-8( وياس تخدام المعادلات )4-8( و )5-8( و )10-8( 
لحساپ Px‏ وتكون asd‏ كل من Dy‏ و 2 = 2. 


ویمکن تبیان أن *م تکافی KR-20‏ للفقرات ثنائية التصحیح ببعد واحد عشوائي: sally‏ 


الأدنی لتوسط PX ph Mp)‏ يساوي p?‏ لذا یمکن للباحث تصور أن 161320 کحد آدنی 


لارتباط متوسطات الربعات مع درجة نطاق اختبارات مبنية بالاختیار العضوائی لفقرات عددها 
0 من نوع صح- خطأ من نطاق الفقرات. 
أخطاء القياس | Aus Lond‏ للقرارات المطلقة والنسيية: 

تستخدم الأخطاء المعيارية بشكل أساسي في تكوين فترة ثقة للقياس. ففي النظرية 
التقليدية يكون لفترة الثقة الصيغة SEM +x‏ إن ترمز ‏ إلى الدرجة الملاحظة وترمز SEM‏ 
إلى الخطأ المعياري للقياس كما حددتها النظرية التقليدية. وتعد هذه الفترة فترة ثقة للدرجة 
الحقيقية. ويكون الوضع أكثر تعقيداً بعض الشيء في نظرية إمكانية التعمیم. وهذه الفترة لها 
الصيغة SEM+S‏ وهنا ترمز 5 إلى الدرجة المستخدمة فى تكوين الفترة. وتعتمد الدرجة 
والخطأ العياري بالأساس على نوع القرار المتخذ باستخدام بيانات دراسة D‏ وثانوياً على 
تصميم الدراسة أو عدد شروط القياس المستخدمة. 

ففي دراسة D‏ حادية البعد هنالك أريعة تعريفات لتباين الدرجة اللاحظة, واحد لكل 
arene’‏ ويمكن تحديد خطأ التباين المزافق للتصميم على أنه ذلك الجزء من تباين الدرجة 
الملاحظ والذي ليس تباين درجة النطاق. فالتصميم وتباين الخطأ المرافق له على النحو الآتي: 


ny Oe تصميم ر‎ 





sd‏ م 








Oe? 02 3 تصمیم‎ 

NY (Oet O77) : 4 تصمیم‎ 

ویحدد الخطاً العياري للقیاس على أنه الجذر التربيعي لتباین الخطأ. ولا یعتمد تقریر 
استخدام أي الأخطاء العيارية بالضرورة على تصمیم دراسة D‏ علاوة على أنه یعتمد بشکل 
آولي في الاستخدام لمن ستوضع الدرجات في دراسة D‏ ومن الهم هنا التمییز بين القرارات 
القارنة والقرارات الطلقة. فالقرار القارن الذي يتخذ بناءٌ على مقارنة درجات الفحوصین 
الختلفین أمثلة على هذه القرارات التي تتضمن استخدام درجات الاختبار لترتیب الأفراد على 
منحنی واختیار الفحوضین ذوو الترتیب الاعلی لیدخلوا في معهد تربوي. ویعتمد الخطاً 
العياري لقرارات القارنة على تباین الخطأ لتصمیم دراسة D‏ فمثلاً إذا أجريت دراسة (1/ 
بتصمیم 3 فان الخطأ العياري یکون ,| 07 Oe‏ 


ویعتمد القرار الطلق على days‏ الفحوص فقط لا على مقارنتها بدرجات الفحوصین 
الآخرین. فمثلاً يستخدم الاختبار محكي الرجم لتحدید ما إذا كان یمکن للمفحوص التقدم 
إلى الوحدة التالية في البرنامج التعليمي. واتضاذ القرار فيما یتعلق بتقدم الفحوص يحدث 
Loss‏ لو تجاوزت درجة ane all‏ عم ای (lula‏ . فعندما تستخدم درجات الاختبار لاتخاذ 
قرار مطلق وياستخدام تصميم أحادي aif‏ . فان الخطأ المعياري للقياس يعتمد على عدد 
الشروط التي قيس الفحوص ضمنهاء وعندما یکون هنالك شرطاً واحداً (تصمیم 1 و 3) فإن 
تباین thal‏ یساوی 0:2 +02 بینما لو كان هنالك عدداً من الشروط (تصمیم 2 و 4) فإن 
تباین الخطاً يساوي OP)‏ +تع0) nV‏ . وکمثال على قرار مطلق افترض أنه تم استخدام اختبار 
مؤلف من 6 فقرات لتقریر سيطرة الطالب على وحدة تعليمية صغيرة في الریاضیات» فإن 
عولجت الفقرات على آنها بُعد القیاس فان القرارات تصور على آنها تعتمد تصمیم 2/ 
دراسة ظ ل =n)!‏ 6 كشروط لجُعد الفقرة. ويالتالي E AR ee EE eas‏ 
ويمكن حساب کل من :© و Oe‏ باستخدام تحليل التباين الثنائي لإجابات الفقرة. 

ويلخص جدول )7-8( اعتماد تباين الخطأ على نوع القرار. ويبين أيضاً الدرجة الستخدمة 
في تشكيل فترة الثقة والمعلم المحسوب لفترة الثقة لتجمعات تصميمات البعد الواحد جميعها 
وأنواع القرارات - مقارنة ومطلقة. إن السوغات والمضامين لمدخلات القرارات المطلقة بسيطة 
فسبياً لذا فانها عرضت أولاً. فللقرار المطلق Wie‏ قستخدم الدرجة الملاحظة للتصميم 
المستخدم لتشکیل فترة الثقة عند جمع بيانات دراسة D‏ وفي تقديرات فترة الثقة لدرجة 
النطاق. لتوضيح استخدام جدول (7-8) مع قرار مطلق افترض أن معلماً طبق اختبار نهائي 
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مؤلف من 100 فقرة من نوع اختيار من متعدد واستخدم نتائجه لتأشير الدرجات المناظرة 
النسب المئوية للاجابات الصحيحة: 


جدول (7-8): الدرجات وتباين الخطا لبناء فترات الثقة المناسبة لتجمع كل من نوع القرار والتصمدم 





A w >‏ 5 ايأ 


0 - 60 
ويعد التطبيق على الفحوصين دراسة D‏ تلف فيه الفقرات بعد القياس المفردء ولأن 
الفحوصين جميعاً تقدموا للفقرات نفسها فإن دراسة D‏ أجريت بتصميم 2. وتعد قرارات 
التدريج قرارات مطلقة إذ أن الدرجة تعطي للمفحوص دون معرفة درجات الطلبة الآخرين في 
اليف راکوت ای جدول )7-8( فإن تباين الخطأ یکون0:2 MiV Oe?‏ والدرجة الستخدمة 
في تکوین فترة الثقة هي Xp‏ وتحسب فترة الثقة من درجة النطاق -Hip‏ وفي هذه التعبیرات 
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تمثل ار عدد فقرات GLAST!‏ ونسبة الإجابات الصحيحة تمثلها Xp‏ ويمكن إجراء حساب 
O95 2‏ باستخدام تحليل التباين الثنائي لبيانات دراسة D‏ 

یلاحظ من جدول )7-8( أن مضمون قرارات القارنة مباشرة شيا ومع ذلك فان 
مسوغات دراسة /D‏ تصمیم 1 معقدة بعض الشي». مع ذلك سنجري توضیماً لدراسة /D‏ 
تصمیم 1ء وملاحظة أن مسوغات مشابهة تطبق على التصمیمات الأخرى, وتذکر أن التصمیم 
1 تصمیم متقاطع یتعرض فيه الفحوصین جمیعاً لشرط قياسي واحد. افترض آننا نجري 
دراسة D‏ باستخدام التصمیم 1 وآنه بامکاننا قياس الجتمع بأكملهء وهذا يعني UST‏ نعرف 
القيمة العددية ل ipj‏ متوسط درجة الجتمم لشرط القیاس الواحد. تحت أي الشروط SASS‏ 
قرارات القارنة باستخدام الدرجة اللاحظة xp;‏ التي تکون مشابهة لتلك التي یمکن اتخاذها 
فيما لو عرفنا درجات النطاق لكل مفحوص؟ يمكن الاجابة عن السؤال بسهولة إذا ميزنا 
حقائق قليلة واسترجعنا النموذج الخطي ل زم<. في البداية نتحدث عن الحقائق: تذکر أن 
قرار القارنة يستخدم مقارنة درجات ملاحظة للمفحوصين. فالتصمیم 1 LESS‏ مقارنة 
الدرجات Xp)‏ ومقارنة الدرجات النحرفة (زلا-زم) إذ أن زا هي نفسها للمفحوصین جميعاً. 
ويطريقة مشابهة فان مقارنة درجات النطاق مكافئة لقارنة درجات النطاق النحرفة (pH)‏ 
وهاتان التکافتتان هي الحقائق التي نحتاجها. والآن دعنا نسترجم النموذج الخطي ل Xpi‏ 


(21-8)........... pi + (u-u) + (u-up) + u = Xpi 
(22-8) ل ع‎ epi تلم‎ u -~ Up = Ly 5 Xpi 


والمعادلة )22-8( تجعل القرار المعتمد على -زم؟2 مشابه للقرار المعتمد على ۵-۱۷ فیما 
لو كانت الدرجات المنحرفة هي نفسها. لذلك فإن الإجابة على سؤالنا هي أن القرارات المقارنة 
المتخذة باستخدام درجة النطاق وتزودنا OL‏ ول - ۸ = زج - Hi‏ ومن وجهة النظر هذه OLS‏ 
الخطا الستهدف في اتخاذ قرار القارنة باستخدام التصميم 1 يتطلب تعويض -api‏ بل مكان 
ولا - ۰۱ وكنتيجة فإن فترة الثقة المناسبة تكون Oe” (Hi - Xpjy‏ والتي تقدر -H -Up‏ ومع ذلك 
فإننا لا نعرف قيمة uj‏ ولذلك فإننا نعوض بمتوسط العينة والذي نرمز له ب Xpj‏ في جدول -7) 
(8. ولتوسط pj‏ تشير P‏ إلى متوسط العينة عبر جميع الأشخاص. 

وی ARE E‏ امم ene Ven mie‏ زعا PEE‏ ی ال ها لکش 
«alee‏ وتذكن pile Ot‏ التفسن Laces‏ بالارضاط مم الكش ویتطلب حسات آلارتباط قرارات 
مقارنة لان الارتباط يقيس إلى أي مدی ارتباط الفروق الفردية على متغیرین. افترض أن alle‏ 
al‏ فر استضيواء اتمه وات 5 وال میرن (08) شان قاين 
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الخطأ ny Oe?‏ والدرجة المستخدمة في حساب فترة الثقة هي Xol - Xpy‏ وتقدير فترة الثقة 
تقديرات الفحوص P‏ و Xp}‏ تمثل متوسط زم×. 

ومن الهم تذکر آن الدرجة اللاحظة في نظرية إنكانية التعمیم عبارة عن التوسط عبر 
الناظرة Yay‏ من متوسط الدرجة في صنع القرار. وفي مثال الاختبار محكي الرجع یظهر هذا 
بمريع عدد الشروط التي قيس الفحوص فیها. وقي مثال الاختبار محكي الرجم فان تباین 
الدرجة الخطأ ل ل: 

(23 - 8( 0 (Ge7+ 0;2) np =[ ny (Oe% 6;2) [ np 
نظرية التعميم للتصميمات ثنائية البعد:‎ 
يُعدين يظهر عندما يستجيب الفحوصین على عدة أسئلة مقالية وتصحيح من قبل عدة‎ 
وعندما تصنف شروط القياس إلى يُعدين فإن النظرية والطرائق المطورة للتصميمات أحادية‎ 
معامل إمكانية الو و دو :ذا انمه تعرس‎ tl اا‎ aad تون‎ deal 
صياغة وتقدیر معاملات الثیات للتصميمات ثنائية الیعد . ویتضمن العرض الموضوعات الآنية:‎ 

1/ الصطلحات لو صف د تصميمات | a‏ لتعميم ونطاقاته. 

2 ایند حه الاق SUI‏ تاش his‏ 

Dass اه الاد‎ taal CAS 

۵ صياغة معاملات إمكانية التعميم. 

5 تقدیر معاملات [مكانية التعمیم. 


المصطلحات: 

يقال على البعدین أنهما تقاطعا Leste (Crossed)‏ يظهر كل شرط قياس في البعد الأول 
مجتمعاً مع كل شرط قياس للبعد الثاني. على سبيل المثال: عند تطبيق كل اختبار من مجموعة 
اختبارات في الواقف العديدة جميعهاء ونقول أن بعدي الاختبارات والمواقف تقاطعت. ويقال 
على البعد أنه تداخل nested‏ مع البعد الآخر إذا ظهرت شروط قياس البعد الاول المختلفة 


240 











مرتبطة مع شروط قياس البعد الثاني جميعها. على سبيل المثال افترض أن كل تلميذ من المكة 
تلميذ أجابوا على سؤال مقالي واحد في الفيزياء» وواحد في الرواية الأمريكية والأخير في 
تاريخ الرياضياتء وحيث أن الموضوعات مختلفة فان مجموعة مقدرين (المصهحين) تصحح 
سؤال الفیزیاء. وثانية لسؤال الرواية وثالثة لسؤال التاريخ. والمجموعة الأولى من المقدرين 
ميهف بو ناشیاه ag laces Sica eal‏ اتقو ای Sa (ALIS So all‏ 
الأسئلة المقالية. لاحظ أنه بالتصميمات أحادية البعد يمكن لبعد القياس أن يتقاطع آو يتداخل 
مع المفحوصين. وفي التصميمات ثنائية البعد فإن أي من البعدين يمكن أن يتقاطع أو يتداخل 
مع المفحوصين. وفي المثال الحالي فإن كل من المقدرين والموضوعات تقاطعت مع المفحوصين 
إذ أن كل مفحوص كتب مقالة (أجاب عن سؤال مقالي) في كل موضوع وقدر من قبل 
المقدرين جميعا. 
تباين الدرجة الشاملة: 

من الضروري قبل وصف نطاقات التعميم وتباين الدرجة الشاملة الناظر تحديد عناصر 
التباين المستخدم في نظرية إمكانية التعميم للتصميمات ثنائية البعد. وهذه العناصر هي: 

Op? -1‏ تباين المفحوص. 

2- 2 قاين شروط العامل الأول i‏ 

o -3‏ تباین شرط العامل ز. 

4- :ره gals‏ التفاعل بين المفحوصين والعامل i‏ 

5- زوت تباین التفاعل بين المفحوصين والعامل ز. 

6- ز0 تباین التفاعل بين الفحوصین والعاملین في و [. 

o -7‏ تباین البواقي. 

ويعتمد تباين الدرجة الشاملة على الأبعاد (العوامل) فإن كان آحدها تابتاً في نطاق 
التعمیم سیکون هنالك خمسة نطاقات تعمیم ممكنة وتباین درجة شاملة لكل منها ومع ذلك 
فمن الهم الاشارة إلى أنه خلال مناقشتنا لنظرية إمكانية التعمیم لبعدین نفترض أنه تم تحدید 
نطاق تعمیم یتقاطع مع آبعاد القیاس (ولا نفترض تقاطع آبعاد القیاس مع بعضها البعض في 
التصمیمات التي تستخدم دراسات G‏ أو D‏ ومن المکن استخدام تصمیم ذو شرط قياسي 
واحد متداخل مع شرط قياسي آخرء مع أن الابعاد تقاطعت في نطاق التعمیم). وقد تم وضع 
هذا الافتراض للحفاظ على النقاش من زيادة التعقيد. هذا ویمکن لنظرية إمكانية التعمیم أن 
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تتناول نطاقات ببعد واحد تتداخل مع غیرها. وقد ناقش کرونباخ وزملاژه (Cronbach etal.,‏ 
)1972 هذا النوع من النطاقات. النطاق 1 : یقترض في النطاق الأول أن البعدین عشوائيين» 
ومثال على هذا النطاق تيم الفاحص عبر صيغ اختبارية عديدة ومواقف قياسء وکل منهما 
كان بعداً عشوائياً. وترمز Op?‏ إلى تباين درجة النطاق» وفي هذه الحالة (الأبعاد عشوائية) 
فاد ن تباين الدرجة الشاملة لا يعتمد على کون تقاطع البعد آو تداخله مع المفحوصين. 

النطاقين 2 و 3 : في هذين النطاقين يكون أحد البعدين ثابت والآخر عشوائيء مع تقاطع 
العامل الثابت مع الفحوصين. ففي النطاقء 2 يكون i‏ البعد الثابت ودرجة تباين النطاق 
يكون nV pit Op?‏ والشال في النطاق 1 يخدم هنا إذا افترضنا أن الواقف عشوائية 
والصیغ المرمز لها بالبعد 1 كانت ثابتة. وفي النطاق 3 يكون البعد ز ثابتاًء لذا فان تباين درجة 
النطاق یکون: pit Op”‏ 72 ونحصل على النطاق 3 عندما تکون الواقف تابتة والصیغ 
عضوائية. وتشير الرموز ny‏ و mp‏ إلى عدد الشروط للأبعاد أ و ز في دراسة D‏ 

النطاقين 4 , 5 : وفي هذين النطاقين يكون أحد البعدین ثايت والآخر عشوائي مع تداخل 
البعد الثابت مع الفحوصین. كمثال عند تدريج الآباء لقدزات أبناءهم في تناول سلسلة مواقف 
ضغط وحيث أن لكل طفل والدين أثنين فقط وهؤلاء مختلفين لكل طفل فإن بعد الآباء يكون 
Ge‏ مع تداخل الآياء مع الأطفالء ويُّعد يُعد الموقف عشوائي. ففي النطاق 4 تكون 1 هي اليعد 
الثابت ويوجد عدد شروط :8 ل 1 تتدلخل مع كل مفحوص, ويكون تباين درجة النطاق 
,02 + 02 جزم02 1۷ وفي النطاق 5 يكون j‏ هو البعد الشابت وتباين النطاق يكون 
و2 + 0j‏ خز02 DY‏ 

وعندما نحصل على تباين درجة النطاق لنطاقات التعمیم جميعهاء یمکننا عرض تباين 
الدرچة اللاحظة التوقعة للعدید من تصمیمات دراسة D‏ وکما سنری في الجزء التالي فان 
معامل إمكانية التعمیم يعبر عنه بنسبة تباين النطاق إلى تباين الدرجة اللاحظة. والذي یعتمد 
على نطاق التعميم وتصميم دراسة .D‏ 
تباين الدرجة الملاحظة المتوقع: 

يعتمد تحديد تباین الدرجة الملاحظة المتوقع على تصميم دراسة (1. وسنعرض خمسة 
تصميمات ممكنة لدراسة D‏ وقد عرض كل من pails‏ وكرونباخ وراجاراتنام و (Gleser, Cron-‏ 
GM bach & Rajaratnam, 1965)‏ تصميمات أخرى. 


I‏ مجتمعاً مع كل شرط لليعد J‏ ويتعرض الفحوص لتجمعات الشروط جميعها. كمثال فعند 

















تطبيق اختبارات عديدة (بُعد (I‏ في الموقف نفسه ويتقدم المفحوصين جميعاً إلى الاختبارات 
جميعها وفي الشروط جميعها. وقدم كرونباخ الرسم pCi Xj)‏ لهذا التصمیم» وترمز P‏ إلى 
الفحوصین و 1 إلى شروط البعد ], و ز إلى شروط البعد [. لذا فان (ز× , POG‏ تشر إلى 
تقاطع الفموصین وشروط التعدية لأ . وفي التصمیم i‏ الدرجة اللاحظة قساوي متوسط 
الملاحظات ng ny‏ وتباین الدرجة التوقع یکون: 








(24 -8) ........ og? سل ,10% سل ,492 نط‎ 10% 
6 ny np J nj ny\ 


تصميم 2: فى هذأ التصميم تتداخل شروط 12 للبعد J‏ مع شروط :2 للبعد 1 وكلا اليعدين 
اللاحظة تکون متوسط nm) ota dU‏ وتباین الدرجة اللاحظة هو: 


(25 -8( ........ 062 + 02 زم‎ +0%p; ل‎ 
ni n j np 


وفي التصميم 2 تتداخل شروط آ مع شروط J‏ (وعلى القاريء ملاحظة أنه يمكن استخدام 
تصميمات معينة لدراسات 6 لحساب تقديرات منفصلة لكل من زم2© و Oe?‏ في حين أنه من 
الضروري في التممپمات الأخرى حساب تقدیر واجد 1 زره + ?06« وینطبق هذا على 
عناصر التباین جمیعها الوجودة بين قوسین في العادلات من )25-8( إلى )28-8( وکل 
Mates‏ مقا oa‏ عق fils‏ ترجه fe A)‏ ۱ 

تصميم 3: هنا يظهر كل شرط ل I‏ مجتمعاً مع daf‏ شروظ ل لذا فإنه يوجد عدد شروط 
كلي nj 21 = K‏ ويتعرض كل مفحوص لشروط القياس K‏ جميعها ويالتالي فإن کل بعد 
يتقاطع مع الملفحوصينء ويرمز لهذا التصميم بالرمز XPOS)‏ . وفي مثال الأسئلة المقالية- 
التصحيح يظهر هذا التصميم Lard‏ لو كان هنالك مصححاً واحداً لسؤال الفيزياء وآخر 
لسؤال الرواية وآخر لسؤال الرياضيات. وتكون الدرجة الملاحظة عبارة عن متوسط الشروط 
HAS sal gully‏ ره 


+02p 








1 
(26 -8) 2 (Ge? + 62 pj+ Op; E +0 p 
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تصميم 4: تتقاطع هنا شروط البعد 1 (nj)‏ مع المفحوصينء في حين تتداخل bag‏ 1:۱ 
للبعد J‏ مع المفحوصين: مع تقاطع البعدين ]و J‏ ومثال ذلك عندما يتم تدريج المعلمين من 
قبل طلبتهم في مساقات عديدة وعلى متصلات التدريج نفسه. ويعد المعلمون هنا هم 
المفحوصين ويؤلف التلاميذ شروط البعد J‏ وإذا افترضنا أنه لا تلاميذ انخرطوا في أكثر من 
مساق, وهكذا يتداخل المفحوصين مع التلامیذ, وبما أن التلاميذ جميعهم استخدموا التدريج 
نفسه (البعد (T‏ والفحوصین جمیعا تم تدريجهم على هذا التدريج فإن شروط البعد 1 
تقاطعت مع شروط البعد 1 والفحوصین, ويرمز لهذا التصميم ب XG : p)‏ . وقد ناقش كل 
من كين وجيلمور وكروكس )1976 (Kane, Gillmorem Crooks,‏ هذا الثال بالتفصیل. وفي هذا 
التصميم تباين الدرجة الملاحظة المتوقع يكون: 





+02 








L 40?pi 


5 o2+ o2 . 
( 1 pj) 5 na 


(Ge? + 02) ni ny 

وهناك تصميم 4 حيث تتقاطع شروط J‏ مع المفحوصين في حين تتداخل شروط 1 مع المفحوصين. 

تصميم 5: هنا تتقاطع 1 مع المفحوصين في حين تتداخل [ مع المفحوصينء بالإضافة إلى 
تداخل [ مع I‏ ويرمز لهذا التصميم ب: (3:*5» ومثال على هذا التصميم الدراسة التي 
تستهدف قياس الوقت المستغرق في المهمةء إن سيتم ملاحظة الطلبة لفترات كل منها 15 
دقيقة؛ وكل التلاميذ تمت ملاحظتهم من قبل الملاحظ نفسه mp‏ لذا فإن الملاحظين تقاطعوا مع 
الفموصین» وكل تلميذ تمت ملاحظته لفترات عددها np‏ من قبل الملاحظين جمیعهم. والفترات 
رده مختلفة لكل ملاحظ وتداخلت الفترات (بعد (J‏ مع الملاحظين (بعد 1), علاوة على أنه لا 
يوجد تلميذين تمت ملاحظتهما في الفترة الزمنية نقسهاء لذا فإن الفترات تداخلت ضمن 
المفحوصين. وتباين الدرجة الملاحظة المتوقع لهذا التصميم هو: 








(28 -8( ........ (Oe? + 07;+07}+0p;) — +O pj +02 


Bj Bj nj 
J في‎ 1 
معاملات إمكائية التعميم:‎ 


إن صياغة معامل إمكانية التعميم المناسب يعتمد على نطاق التعميم وتصميم دراسة D‏ 
وحالما يتم تحديد النطاق وتصميم دراسة .D‏ وحالما يتم تحديد النطاق وتصميم دراسة D‏ فإن 





وجنات مر وميم سس مير يت Seren‏ الاد 


ABN 











/ قاع و‎ 2 is 
GIG أسئلة المقال‎ 


فیزیاء» ورواية. ورياضيات التي صححت من قبل مصححين عدة» وافترض أن نطاق 
التعميم حدد بمعالجة الأسئلة (البعد (I‏ على أنها بعد ثالث والمصححين على أنهم بعد 
عشوائي» هنا يكون نطاق التعميم هو تصميم ۰2 وإذا أجريت الدراسة D‏ بتصميم 2 OB‏ 
معامل إمكانية التعميم المناسب يكون: 

nl 02 pit Op? 
= م‎ 
np nioe? 40%pj)+ جزم اط‎ Op? 

اختیار تصمیم دراسة 2G‏ کمبدا cans‏ ان تحسب معاملات إمكانية التعمیم من البیانات التجمعة 
من دراسة 0 والتي تجري قبل دراسة D‏ وهذا يسمح للباحث الحکم على ما إذا كانت بیانات 
دراسة 8 لها إمكانية تعمیم مناسبة. وفي تصمیم دراسة G‏ يجب الوازنة بين قضایا ثلاث: 

الأولى: يجب أن یکون تصمیم دراسة G‏ منسجماً مع نطاق التعمیم الذي یفکر الباحث فیه. 
مثال ذلك إذا اراد الباحث اعتبار صیغ الاختبار (بعد (I‏ بعداً عشوائياً ومواقف القیاس (بعد 
(J‏ بعداً ثابتاً في نطاق التعمیم. فإن تقاطعت الواقف مع الفحوصین في النطاق فان التصمیم 
یکون نطاق 3 وضمن هذا النطاق فان استخدام تصمیم 4 بوجود تداخل بين الفحوصین 
والواقف لا يؤثر على شيء. والمبدأ هنا أن البعد الثابت الذي تقاطع مع القحوصین في نطاق 
التعمیم يجب أن یتداخل مع الفحوصین في تصمیم دراسة 6. ۱ 

الثانية: إذا كان التصمیم يسمح بتقدیر عناصر التباین لتباین درجات النطاق» فإن كان 
تباين درجات النطاق بتضمن تباین عنصر معین» وفي الوقت نفسه لا يسمح التصمیم بتقدیر 
هذا العنصر فلا حرج من اعتبار التصمیم على أنه تصمیم دراسة G‏ ممکن. وقد تم |عداد 
جدول )8-8( ليسمح للقارنيء بتناول هذه القضاياء فهو يقدم التصمیمات الناسبة لدراسة G‏ 
لكل نطاق تعمیم. وپاستخدام جدول (8-8) لثال الاختبار والواقف نری أنه وللنطاق 3 تکون 
التصمیمات )5,4,2,1( مفيدة في تصمیمات دراسة G‏ 

الثالثة: عدم تجاهل حقيقة أن البیانات التجمعة لتصمیم معين في دراسة G‏ لا يمكن 
ااا تفر سای ای الدرحة اللاشظة لتمتميمات دراسة Agee: D‏ ویک 
الهدف في اختیار تصمیم دراسة 0 التي یمکن استخدامها في حساب تباینات الدرجة 
اللاحظة SY‏ عدد ممکن من تصمیمات دراسة D‏ ويؤشر الجدول )9-8( تصمیمات دراسة 
G‏ التي يمكن استخدامها . 
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gaa‏ (8-8): تصمدمات دراسة 6 لكل نطاق تعميم 


he 


ae 


إلى أبعاد ثابتة, 


las 


طع آو 


تند 


just‏ ولا 


تؤدي 


إلى مضامين لاختيار تصميم 


G دراسة‎ 


حدول (9-8): تصممات دراسة G‏ المحتملة لحساب تباين 
الدرجة الملاحظة المتوقع في دراسات D‏ 





0 SI 


لحساب تباين الدرجة الملاحظة لتصميمات دراسة D‏ جميعها. لذا فإن كان تصميم 1 
عملي فيجب استخدامه في دراسة G‏ لاحظ أن التصميم [یسمح بحساب تباينات الدرجة 
اللاحظ لتصميمات D‏ الثمانية الممكنة. وقي اختيار تصميم دراسة D‏ لمثال الصيغ والواقف 
(نطاق 3) يجب إهمال التصميمات )5,4,3,2( وذلك لأنها لا تغير فى تصميمات دراسة G‏ 
وهي كذلك لتصمیمات دراسة ‏ في الثال. ۱ 
حساب معاملات إمكانية التعميم: 

حالما يتم إجراء دراسة 6 فان تحليل التباين الناسب للبيانات يؤدي إلى حساب عناصر 
التباين المطلوية لحساب معامل إمكانية التعميم. وهناك محددات تمنع إجراء المعالجة التامة 
لتحليل التباين للتصميمات كلها. ومع ذلك فان عوامل كل منها مبينة في جدول )10-8( 
بالإضافة إلى متوسط المربعات المتوقع لكل عامل منها. وتم صياغة هذه المتوسطات من خلال 
عناصر التباين التي حددت فيما سبق. والقراء الذين ليس لديهم معرفة بتحليل التباين قد 
یجدوا بعض متوسطات المريعات فى التصميمات من (2 إلى 5) مريكة فى البداية. مثلاً خذ 
مصدر تباين [ : 1 في تصمیم 2 وباستخدام النتائج التجريبية التي قدمها ميلان وجلاس 


=== 7 












































TEAMS un و یی وه‎ ramen ttre nn tegen 


npoj;? +0p;? يكون متوسط المريعات المتوقع على النحوالکتی:200:2‎ (Millman& Glass,1967) 
التداخلة مع شروط ف ومع ذلك یمکن‎ j عبارة عن تباین شسروط‎ EEEN 
AA (10-8) والجانب الأيسر من المعادلة مستخدم في جدول‎ Ojj 0j رف‎ iol 0 
و زو‎ Op? ن حساب 22 كمأ حدد في العادلة )29-8( فان عناصر التباين الضرورية هي‎ 
الدونة في جدول )10-8( للتصميم 2 فإن عناصر‎ EMS على‎ Hal (Oe? 9 3 


P. 

TA MSpi - MS, يه‎ 

ni n; e p‏ و هوجو 
MS,- MSpi , 5‏ 
E Di =O pi‏ 30ب 
(MS = Òe? + 6%,‏ | 

بحسي معامل إمكانية UW)‏ باستخدام المعادلة: 

ويحسب إمكاند يم + è‏ 

4 ۸ 
NY Opit Gp? 
(31/58) vacates, es By 
A 
DY NYY Og? 407 pit nV Opit Op 
)5 متوسط الربعات المتوقع للتصميمات (من 1 إلى‎ :)10-8( Youn 

التصميم 1 

EMS SV 

Oe? * nj و80‎ +NjO*pj + ny O pj P 

Oe? * nj npOj + Ny Opi + و02 و12‎ 
Oe? * nj DpOj + Dj oj + 0م‎ 
Oe? * nj Opi pl 
Oe? * nj 07; Pj 
Oe? * Dp 07; H 
Oe? 





ا oag,‏ رسيي يس سس ممم یج سيول 








2 التصميم‎ 
SV 


j:1 
pL 
البواقي‎ 


3 التصميم‎ 
SV 


| 
البواقی 


البواقي 


EMS 
Oe” tory tn jop” ++ 8j Opi 
Oe? * Oj + زو‎ 02+ nj 0i ni (o; (زز0+‎ 
Oe? م02‎ + nj (o; +02; 
Oe” تون+‎ + nj Opi 


2, 
Oe? t زوث0‎ 


EMS 
Oe? tO?pj + Opi +k Op 
Oe? + 02 زم‎ + Opi + Np (07, * oj 40%) 
Oe? +o pj + Opi 


EMS 
082+ 62 * inj Op? * nj Oi tn; (o? +0p1) 
Oe? + 07); * npnj Oj + nj Opi 
Oe? + زگ‎ + nj Ovi 
Oe? * رشن‎ * ni (0; 407pj) 
7 e? + 0jj 


EMS 
Oe? + o?) +0 + Oyj + 12:1 oO; + nj Opi 
Ce + o2 + + Oyj + nj Opi 


2+ o2. te.. ا‎ 
کول‎ t O*j TO" Opi 
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مثال: 

لنأخذ اختبار مقالي يكتب فيه المفحوصين مقالات في مواضيع ستة. وفي دراسة إمكانية 
التعميم لدرجات هذا الاختبار فإن الفاحص سيعالج IS‏ من المواضيع والمصححين على أنها 
أبعاد عشوائية؛ وهذا عبارة عن تصميم 1ء لذا فان تباين درجة النطاق هو Op?‏ وبالعودة إلى 
جدول )8-8( نجد أن استخدام التصميم 1 في دراسة © سیسمح بتقدير تباين الدرجة 
الملاحظ لأكبر قدر من تنوع تصميمات دراسة D‏ ولنفترض أن استخدام التصميم قابل 
للتطبيق كدراسة IMG‏ فإن الباحث سيجري دراسة G‏ باستخدام هذا التصمیم. وقد تم 
اختبار سبعة مفحوصين کتبوا مقالات فى موضوعين وقد صممت المقالات بوساطة ثلاثة 
oun‏ ونان هدول [11-8) خلا تخليل الاين لفات درا © 

كيف يمكننا استخدام بيانات جدول (11-8) في اختيار تصميم دراسة D‏ في جمع بيانات 
الفحوصین. افترض أن الباحث وجد أن استخدام ستة ERES‏ هلا في دراسة D‏ ومع 
هذا العدد من الصححیی فان sal‏ تصمیمات دراسة D‏ الم کنة هو التصمیم 1. وپاعطاء 
بایان آلرمر ل وی الوسوهات TSW‏ تسل poole‏ 5 نله 
مصححين )= 6( وستة موضوعات nj)‏ = 6). ویکون تباین الدرجة اللاحظ لللتصمیم 1 
هو: 


(32 -8) ........... nÀ pV Oe? + n\/ لازم + وش‎ Opi + م02‎ 


وكنتيجةء فإن معامل إمكانية التعميم الناسب هو: 
0p 07‏ 
nà nV Ie? + 2 3 + ae ۳ op j‏ 

.6 = nj = n =K فإن‎ 


وتباين الدرجة الملاحظ يكون: 


(34-8) دب‎ K/ ثوت)‎ + O?pjt opi ) + op 
وبالتالي فإن معامل إمكانية التعميم المناسب هو:‎ 

o2 
(35 -8) asec p 5 





K/ (Ge? + O?pjt Opi) + 2 


P 











والخطوة التالية هي تطوير معادلات لحساب عناصر التباين الضرورية لكل معامل إمكانية 
تعميم. ولحساب کل من Gals‏ الدرجة الملاحظ وتباين النطاق يجب أن نحسب 07 xo‏ 


الآتية: 


جدول )11-8( خلاصة تحلیل التباین لتصميم ثنائي masi‏ 





(MS, + MSpj - MSpi - MSp) 


136 - ا ا‎ P2 حك‎ 
(f 36 -8) ........... ni nj p 

E EAN, M e o 

j 

MS, - MSp; ۸ 2 

MM C2‏ مانو 0 نها 

MSi ph‏ (8- 36 ج) 
(a 36 -8( ........... MS, = oe2‏ 


وبالتعويض المناسب باستخدام بيانات جدول )11-8( في معادلات )36-8( نحصل على: 


2 )11.095 - 1.301 - 4.547 + 1.087( 
07ح —— =1055 


6 





























0.071 = 


1.087 - 1.301) ^ 


و )4.54 - 1.087( 


1.730 = i يي‎ p 
1.087 و نمع‎ 
وبتعویضص هذه التقديرات في المعادلة 33-8 نحصل على:‎ 
0.76 = 1.055 p? 


n a ع‎ 
36/1.037 + 6/1.730 + 6/.071+1.055 


0695 105  و‎ 
6/(1.087 + 1.730 + .071) +1.055 


ويما أن IS‏ التصميمين آدیا إلى معاملات إمكانية تعميم ليست مختلفة كثيراً؛ وحيث أن 
تصمیم3 ای وفنا أقل من كل مسصهم: يمكننا تقديم النصح للفاحص باستخدام 
تصمیم 3. 

افترض الآن أن الفاحص شعر أن كلا التصمیمین آدیا إلى معامل إمكانية تعمیم مناسب. 
مع ملاحظة الفاحص أن عنصر التباین الساهم باکبر قدر في تباین الدرجة اللاحظ هو pj‏ 
والنین یعزی إلى تفاعل الف حوص والصحح. ویمکن تقلیل أثر هذا العنصر بزيادة عدد 
Mia Geet‏ يدقن استخدام مصححين أثنين لتصحیح کل مقالة في دراسة D‏ وبتداخل 
المصححين مع الوضوعات. وكل منهما يتقاطع مع المفحوصين. ويعد هذا مثال لتصميم 2 ب 6 
= و از = 2 Lay)‏ أنه في التصمیم 2 أن na‏ ليست عدد الصححی الكلي. ولکنه عدد 
الملصححين لكل مقالة). ويكون معامل إمكانية التعميم المناسب: 

o 


; A 
: 2 
POET n aaa aa aa aa جيه‎ 0 
از‎ DV (Oe? + Opj2)+ niv Opi + م‎ 





Tee o n ° gurgan: n mm o n 








د ام ر aadik aan n‏ مت 


1.055 5 
12/(1.087 + 1.730) + 6/.071 +1.055 


لذا فإن تصميم 2 (وبمصححين أثنين لكل موضوع) يزيد من معامل إمكانية التعميم فعلياً 
أكثر من تصميم 3 (مصحح واحد لكل مقالة)» وهذا يؤدي إلى زيادة متوسطة عن التصميم 1. 
ومع ذلك فإن c‏ التصميم 2 يتطلب 12 مصحح الذي قد يكون غير ممكن عملياً Sly‏ كان سكا 
فمن الأفضل استخدام تصميم 3 وزيادة كلاً من عدد الموضوعات والمصححين. 





3 0 a i ویست‌خدم 3 تعریف‎ oo أو يتداخل مع‎ a 
٠٠ تحديد الأيعادء وییان تصثيف البعد على أنه ثابت آو عشوائي» ووضف التقاطع‎ 
z أو التداخل بين الأبعاد:.وييان ما إذا كان كل بعد يتقاط آریتداخل مج‎ 








oe:‏ تسه 3 9 : 253 ا 
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التمارين: ‏ . 
1/ باستخدام البيانات المدونة في جدول (1-7) وجدول (3-7) أنجز الهام الآتية: 
الاختباري الفعلي أخذت عينة عشوائية مؤلفة من (20) فقرة وطبقت على 
الفحوصين. احسب معامل إمكانية التعمیم لهذا الوقق. 


مدخل الى نظرية التعمیم 


Ree n n, 








بت es Sat‏ وف وو ل الا :قشو لضو من الاف 
الاختباري المذكور في )1( وستستخدم نتائج الاختبار في تقدير نسبة الفقرات التي 
ره التلمية تمن الله اسن كر اله نتاس ارين نمضيل على انر 
(20) في الموقف الاختباري الفعلي. 

ج- أحسب معامل إمكانية التعميم المناسب لموقف تقدم فيه الطلبة لاختبار مؤلف من 
)10( فقرات أخذت من الملف الذکور في (1). 

2 مختص في القیاس مهتم في معرفة ما Lal‏ كان الاطفال الكبان یظهرون تفضیلا 
لاختیار آحد ily‏ الاستجابة في اسئلة اختیار من متعدد. وقد بنی هذا الباحث أربعة 
صیغ اختبارية في الحساب تالف JS‏ منها من )20( فقرة, وطبقها جمیعاً على )43( 
تقوم نی الق MGW‏ ركان عدن Ig‏ المبسيعة لكل يديل فى وا 
وصحی الباحث الاختبارات باستخدام الخطط الاتي: ۱ 


البدیل ste‏ التقاط 
j‏ 1 
= 2 
> 3 
4 4 


ويبين الجدول الآتي نتائج تحليل التباين الثنائي: 





== 5 









































أحسب معامل إمكانية التعميم الذي يؤشر إلى ما إذا كان التلاميذ يميلون لتفضيل بديل 
ما وياتساق.. 

3 بالاعتماد على مواصفات دراسات D‏ المبينة آدناه» نفذ المهام التالية: 

1- حدد أبعاد الدراسة. 

ب- حدد أي الثبعاد - إن وجدت - ثابتة في نطاق التعمیم. 

ج- اكتب الصيغة الرمزية للنطاق ولتباين الدرجة الملاحظة. 

د- على افتراض أن بيانات دراسة 6 المتوافرة أجريت باستخدام تصميم دراسة D‏ بين 
كيف يمكن حساب عناصر التباین المطلوب. 

أ- اختبار نهائي مؤلف من )50( فقرة طبق على فصل دراسات اجتماعية. 

ب- صيغة اختبارية قصيرة لاختبار تفهم الوضوع مؤلف من 10 بطاقات طبق على 50 
مفحوص, ويتطلب هذا الاختبار من المفحوصين Lind GUS‏ قصيرة تنطبق على كل 
بطاقة. وسجلت القصص العشر التي قدمها جوقنیل دیلینکویت» ودرج كل تسجيل من 
قبل ثلاثة مختصين نفسيين لدرجة رفض السلطةء وكانت درجة جوقنيل هي متوسط 
التقديرات الثلاثة. 

ج- في دراسة للعوامل المرتبطة بالكفاءة الكتابية كتب كل مشترك ثمانية مقالات مقالين 
لكل نمطء من الأنماط الآتية: وصفي» قصصي, تفسيري, جدلي. واختيرت موضوعات 
مختلفة لكل dood‏ ولكن المشتركين جميعهم كتبوا في الموضوعات نفسها. و 
الموضوعات لعدد وحدات (i)‏ على أنها مقياس للتعقيد التركيبي. وحسبت الدرجة ‏ 
النهائية للمفحوص بحساب متوسط درجاته على المقالات الثمانيةء وصححت القالات 
جميعها من قبل مصحح واحد. 

د- أجريت دراسة للعوامل المرتبطة بالتحصيل القرائي وطبقت الدراسة على 50 صف 
دراسي من مستوى الثالث. واستخدم الصف الدراسي على أنه وحدة التحلیل. 
واستخدم متوسط درج الصف كمقياس للتحصيل في اختبار القراءة التحصيلي 
(ولأهداف إكمال دراسة D‏ افترض أن عدد الأطفال متسای في الصفوف الدراسية 
جمیعها). ۱ Í‏ 

4 آجریت دراسة |مكانية تعمیم تهتم بالتفاعل العائلي في التاحف. Sf‏ تم ملاحظة 
سلوکات 15 غائلة اختیرت عشوائیاً من قبل ملاحظین آثنبن لكل عائلة وفي BIG‏ 
مواقف. وکان آحد التغیرات التي آهتم بها في الدراسة الوقت الذي يستغرقه الوالدین 
بدون تفاعل مع الطفل. ویلخص الجدول الآتي خلاصة تحلیل التباین على هذا التغیر: 




















باستخدام هذه النتائج نقذ الهام الاتیة: 

أ- خطط الفاحص لإجراء دراسة للارتباطات للفترات التي يستغرقها الوالدین دون التفاعل 
مع أطفالهم Lele‏ بأنه تم ملاحظة العائلات من قبل مقدر واحد وفي موقف daly‏ 

ب- إن كان ممكناً من الناحية العملية للفاحص في )1( زيادة أي عدد من الواقف الملاحظة 

جد افترض أن الفاحص استخدم BIE‏ ملاحظین یمکن لكل منهم ملاحظة العائلات في ` 
موقفين على الأكثر. وعلاوة على ذلك فانه يمكن سؤال کل عائلة من )30( عائلة على 
الأقل في ستة مواقف. فأي التصميمات يكون قابلاً للتطبيق مع هذه الحددات؟ وأيها 
ينتج عنه أكبر معامل إمكانية تعميم. 

د- افترض أن الفاحص خطط لاجراء الدراسة باستخدام المواقف الثلاثة متغير ثابت. 
احسب معامل إمكانية التعميم المناسب لهذا التصميم. 

ه- افترض أن الباحث خطط لإجراء الدراسة فى متحف مختاف, ولكنه خطط لثلاثة 
مواقف ومقدرين أثنين كما هو الحال في دراسة D‏ لأي من الفرعين (د » ه) يكون 
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الفصل التاسع 
معاملات شبات الاختبارات محكية المرجع 


يتألف الاختبار التحصيلي file‏ من مجموعة فقرات يعتقد بأنها تتطلب المهارات والقدرات 
التي تمثل أهداف التعليم. . Cag‏ جلیسر )1936 (Glaser,‏ إن درجات الاخخبارات التحصيلية 
تزودنا بنوعين من المعلومات» أحدها الموقع النسبي لدرجة الفحوص على توزيع الدرجات. 
وكتابة نتائج الأداء في الاختبار على شكل درجات زائية 5353 هذل هده المعلومات. والمعيار 
المستخدم هنا في تفسير الاداء الاختباري يكون من النوع النسبي» والدرجة اممعطاة 
للمفحوص تسمى القياس معياري الرجم. والنوع الثاني من العلومات هي days‏ اکتساب 
الطالب لأهداف التعلیم. ومثال بسيط لهذا هو درجة النسبة الصحيحة للمفحوص في اختيار 
يغطي مئة حقيقة في عملية الجمع. فإذا الختيرت فقرات ت الاختبار عشوائياً من الفقرات الممكنة 
جميعهاء فإن درجة نسبة الاجابات الصحيحة يمكن اعتبارها تقدير لعدد الحقائق التي يعرفها 
التلمید وبالتالي (Sas‏ تفسيرها دون معرفة آداء المفحوصين الآخرين على الاختيار» وفي هذا 
الثال فإن نسبة الاجابات الصحيحة تعد قياس محكي الرجم. 

وكما حدد من قبل جليسر فإن التمييز الأساسي بين القياس معياري المرجع والقياس 
محكي المرجع هى المعيار الذي ينسب إليه الأداء. وظهر مصطلح القياس محكي المرجع في 
تعريف جليسر على أنه «.. هو تقييم للسلوك gel‏ اولخدي . ويستخدم المصطلح قياس 
محكي المرجع كبديل للمصطلح الأكثر إن Late:‏ «قياس السلوك محكي المرجع» والذي يشير 
إلى أنه يمكن تفسير القياس من خلال سلوكيات محكية يمكن أن يظهرها الطالب gf‏ 
الفحوص. والمصطلح معياري في القياس معياري المرجع يشير إلى حقيقة أن هذه القياسات 
تفسر من خلال معاییر الاختبار (أنظر الفصل 19- مناقشة jules‏ الاختیار. 

وفي عام 1969 أكد JS‏ من بويام وهيوسك )1969 (Popham & Husek,‏ أن التقنیات التوافرة 
في بناء الاختبار» وتقدیر الثبات. وتقييم الصدقء وتحلیل الفقرات تم تطویرها بشکل موسح 
للاختبارات معيارية المرجع. وتتطلب الاختبارات محكية المرجع من وجهة نظرهم تقنيات جديدة 
في كل من هذه المجالات. وقد صاغ لیقنجستون )1972 (Livingston,‏ وهامیلتون ونوقيك (Ham-‏ 
belton & Novick, 1973)‏ معاملات جديدة لثيات القياس المحكي. ومنذ نشر هاتين الدراستين 
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كرس sae‏ كبير جداً من أدب القياس لصياغة هذه المعاملات. وتم مراجعة أدبيات الوضوع 
في هذا الفصلء ومن المراجع الأخرى للموضوع : (Berk, 1980, a,b)‏ وبرینان )1980 (Brenan,‏ 
وسبکوقياك )1980 (Subkoviak,‏ وتراوب ورولي (1980 (Traub & Rowley,‏ 


استخدامات القياس محكي المرجع 

Lais‏ يتم تسیر القياس على أنه محكي المرجع من خلال السلوكات المحكية التي يظهرها 
الفحوص فان الاختبار المحكي يجب تصميمه ليسمح بمثل هذا النوع من التفسيرء والعديد 
من كتبة الاختبارات يبدأ بناء الاختبار محكي المرجع بتحديد المجال أو مجتمع الهام التي 
يجب أن يكون الفحوص قادراً على آدائها (آنظر۰1974 Millman‏ لوصف طرائق تحديد 
المجال). ويبني الاختبار بمعاينة المهام من مجال المهامء وأثنان أو أكثر من هذه الاختبارات 
تسمى اختبارات متكافئة أو متوازية أسمياً أو عشوائياً. واشتقت هذه الأسماء من حقيقة أن 
مثل هذه الاختبارات تعد متوازية في المحتوى ولكنها ليست متوازية تماماًء فليست بحاجة 
لتساوي متوسطاتها وتبايناتها أى ارتباطاتها مع الدرجات الشاملة. وهنالك هدفين مرتبطين 
بهذه الطريقة في بناء الاختبار محكي aa ll‏ على نتائج الاختبار (Hambelton, etal,‏ 
.1978a)‏ الأول: تقدير درجة النطاق» ويدقة AST‏ نقول أن درجة النطاق للمفحوص P‏ هي نسبة 
الفقرات فى النطاق التي يمكن أن يجيب عنها الفحوص P‏ إجابة صحیحة۲. ودرجة النطاق 
هذه هي الدرجة الشاملة في نظرية إمكانية التعميم. وهنا یتالف نطاق التعميم من جميع فقرات 
النطاق الكلى للفقرات» ودرجة النطاق (أى الدرجة الشاملة) للمفحوص P‏ هي متوسط درجاته 
على جميع الفقرات. والثاني: في موقف السيطرة. والذي يقسم فيه متصل درجة النطاق إلى 
فئات سسيطرة تحدد يدرجات abd‏ عددها (K-1)‏ وتستخدم نتائج الاختبار اللاحظة في 
تصنيف المفحوصين إلى فئات السيطرة 

والمثال الأكثر شيوعاً هو درجة قطع واحدة وفئتين مسيطر وغير مسيطر. ويما أن هنالك 
هدفين مختلفين تم تحديدهما لدرجات الاختبار محكي المرجع (تقدير درجة النطاق وتصنيف 
السيطرة) فإنه يتطلب الحاجة إلنى وجود طريقتين مختلفتين لحساب ols‏ كل (Traub lagis‏ 
Rowley, 1980)‏ &. 


نظرية الثبات لدرجة النطاق المحسوية: 


خذ كمثال موقف تقويم منهج إسباني جديد يريد المقوم بوساطته تقييم المدى اللفظي 


)1( سنهتم بهذا الفصل في موقف القياس التي تكون درجة النطاق فيها متغير متصل. والقراء المهتمين 
بالمواقف الأخرى التي للمفحوصين قدرة على الإجابة عن جميع الفقرات أو المهام of‏ لا شيء منها يمكنهم 
الرجوع إلى تراوب ورولي )1980 (Traub & Rowely,‏ 
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التوافر لدى كل مفحوص. والنطاق هنا عبارة عن الكلمات الاسبانية المذكورة في المنهج 
جميعها. ولأسباب تطبيقية واضحة يمكن اختبار التلاميذ بعدد محدود من الكلمات فقط 
وينوي lI‏ 9% استخدام درجة النسبة الصحيحة الملاحظة على آنها تقدير لدرجة النطاق 
التلمیذ: أي نسبة الكلمات التى يعرفها التلميذ. ولكن ما درجة دقة التقريب لنسبة الاجابات 
EOR]‏ ا لدرجات النطاق؟ فان كان اهتمامنا بالاختبارات المبنية بالمعاينة العشوائية 
من عينة Y‏ نهائية من الفقرات فان الإجابة على السؤال تكون من خلال نظرية إمكانية التعميم 
المبينة فى الفصل 8 للتصميمات أحادية اليعد. وعلاوة على أنه يمكن تعديل هذه النتائج 
لتتوافق Pa‏ ملف لا نهائی من الفقرات )1972 (Sirotnik,‏ والمعاينة. الطيقية (Rajaratnam,‏ 
Cronbach & Gleser, 1965)‏ 

ومن وجهة نظر نظرية إمكانية التعميم فعندما يطبق åa‏ الاختبار اختبار الألفاظ الإسبانية 
انه رى دراسة P‏ يتقاطع فيها المفحوصين مع الفقرات. وتم الترميز لهذا التصميم ب ۳ 
وأعطي مسمى تصميم 2 للتصميمات أحادية البعد. وهنا يستخدم المقوّم درجة النسبة 


. الصحيحة الملاحظة على أنها تقدير لدرجة نطاق الفحوص P‏ (آو الدرجة الشاملة). وفي 


التحقق من مدى جودة تمثيل الدرجة الملاحظة لدرجة النطاق فإن هنالك كميتان يجب الاهتمام 
بهما: ۱ 

الأولى: تباین الخطاً si)‏ جذره التربيعي والذي هو الخطاً العياري للقیاس), والثانیه هي 
معامل امكانية التعمیم. ولأسباب ستناقش في الحال یفضل استخدام تباين الخطاء ولذاك 
bes‏ نيدأ بمناقشة تباين Losie hall‏ تکون درجة نسبة الاجابة الصحيحة اللاحظة تقدیر 
لدرجة النطاق. ویعد معالجة درجة نسبة الاجابة الصحيحة على آنها تقدیر لدرجة النطاق هو 
مقال لقرار مطلق, ویجب أن یسترجم القاريء من فصل )8( إن القرار الطلق هی قرار یعتمد 
على درجة الفحوص دون الرجوع إلى درجات الفحوصین الآخرین. 

وكمراجعة للمقاهيم الناسبة لهذا النقاش فقد يرغب القاريء فحص البيانات المقدمة في 
جدول (1-7) التي تحتوي استجابات 10 تلاميذ np)‏ = 10) على اختبار مؤلف من 6 فقرات 
ni)‏ = 6( ويبين جدول )2-7( حساب معامل ثبات کیودر- ریتشاردسون 20 لهذه الفقرات. 
وجدول (3-7) يبين كيفية حساب هذا العامل وذلك بطريقة تحليل التباين لهويت. ویتضمن 
جدول (1-9) ملخصاً لهذه المعلومات والمهمة في توضیح كيفية الحصول على تقدير الثبات 
فيما لو تم تفسير الدرجات على آنها محكية المرجع. وتحديداً فإن تحليل تباين الافراد ‏ 
الفقرات بودي إلى ثلات كميات هي: 

مریم متوسطات الافراد (MSp)‏ ومریع متوسطات الفقرات (MS)‏ ومريع متوسطات 











Sy Lal E‏ توق همان ۵ ی تم نوك EE‏ الج الا ن 
تقدیرات لعناصر معاملات إحكانية التعمیم. وکما هو ملاحظ في دراسة D‏ آحادية الب (وکما 
هو الحال في مثالنا) وبمعالچة الفقرات علی اها الع فان عناصر الاين للافرادوالفقرات 
جدول (1-9): خلاصة استجابات الفقرة ونتائج تحليل التباین من الجداول 
)1-7( إلى )3-7( للفقرات الستة والفحوصین العشرة 


الفقرات 





6817 9 07574 الأقراد‎ 
1483 ۰ 5 2967 الفقرات‎ 
6683 45  . .1485 . البواقي‎ 
حسایها ب:‎ (Sas 
EM, EMp ره‎ 
nj 
np 
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2 
وفي مثالنا فان .0 هو تباين صعويات الفقرة لنطاق الفقرات» و Og?‏ يعكس خط القياس 
وحقيقة أن أرجحية الإجابة الصحيحة لمفحوص عن فقرة إجابة صحيحة ستتغير من فقرة 
لاخری» وباستخدام العلومات المبينة في جدول )1-9( لهذا المثال فإن: 


0.1485 - 4 


= 2 
6 ie 

0.1015 = 
0.1485 -0.2967 — , 

10 
0.0148 = 
(1-X,)) x 

)1-9( CXD مك‎ = 502+ 2 


(1-nj) ny 


حيث ترمز Mp‏ إلى عدد المفحوصين و إم× إلى نسبة الإجابات الصحيحة للمفحوص P‏ 


ech aca‏ ا فا هه ا ف Geek all‏ یفن إلى oe.‏ . لذلك فان 
a :‏ 


تباين الخطأ لا يمكن أن يكون آکبر من 025 ومن ثم فإن الخطأ المعياري يجب أن يكون أقل 
من,أ0.25 آو 0.158 رپاستخدام المعادلة )1-9( وبيانات جدول )1-9( نحصل Ge? + O; ple‏ = 


0.25 + 2211 + 0.1411 + 0.25 + 0.1411 + 0.00+0.00 + 0.2211 + 0.1411 + .00 








)10( )5( 
= 0.0273 
وحيث أن تباين الخطأ هو 02 +092 n/‏ فان هنالك معامل إمكانية تعميم واحد ممكن 
لدرجة النطاق هو: 
Op 2‏ 
VA z‏ 


n;/ (Oe? + o2 + Op 
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وهذا العامل يساوي 1 إذا كانت درجة الاجابة الصحيحة اللاحظة لكل مفحوص تساوي 
درجة النطاق للمفحوص. لذا فإن العامل الکبیر يؤشر إلى تقدير دقيق لدرجات النطاق. لنری 
هذاء افترض أن الفحوصین جمیعهم حصلوا على درجة النطاق نفسهاء أي أن 02 = صفرء 
وبالتالي فان PL‏ = صفر. والآن إذا تالف الاختبار من 11 فقرة فان أقصى قيمة لتباين الخطاً 
= 0.025 وإذا كان تباين الخطاً الحسوب = 001. فقط فان الدرجات الملاحظة تكون تقديراً 
Yule, Langs‏ لدرجة النطاق الفردة. لذلك of‏ كان تباین hall‏ المسوپ = 2025 فان 
الدرجات اللاحظة لا تکون تقديراً دقيقاً جداً لدرجة النطاق. 


ومع ذلك ففي كلا الحالتین ]م = صفرء لذا فمن الواضح ان معامل امكانية التعمیم 
النخفض لا پشیر Latte‏ الى قياس غیر دقیق. ووجهة نظرنا أن قاين الخطاً الحسوب 

والتفسیر معياري المرجع لدرجة النطاق في بعض الحالات هو adil‏ . وفي هذه الحالة فان 
سوال الثبات يدور حول درجة جودة تنبق درجة الاجابة الصحيحة اللاحظة (Xp)‏ بدرجة 
نسبة الاجابة الصحيحة للنطاق (Up)‏ فان كانت رم تتنباً ب ملا بالضبط فان اي تفسیر 

02 
eee! =p 
7 6 P 

وسيساوي واحد عندما يكون التنبق LG‏ وصفر عندما لا تفيد Kp‏ في التنبق عن Mp‏ 
ويكون معامل امكانية التعميم مفيداً في التفسير معياري المرجع للاختبارات محكية المرجع. 
والتقدیر في متالنا هو: 


وو ا E‏ 


6/0.1485 + 0.1015 


== 265 



































وکما لوحظ فی الفصل الثامن للبيانات الثنائية فان Mp)‏ , إم::) 07 تكاقيء مريع الارتباط 
یتطلب بناء ثلاثة صیغ اختبارية وتطبیقها . 


نظرية الثبات لتصنیف السیطرة: 

ان دقة درجات الاختبار کتقدیر لدرجات النطاق تکون اقل اهمية عند استخدام الاختبار 
في تصنیفات السيطرة. لنعد الى اختبار الالفاظ الاسبانية ثانيةء وافترض ان نقطة القطع في 
هذا الاختبار هو ان يحصل القحوص على درجة القطع او درجة اعلی متها لیصنف كمؤهل 
لدراسة المحادثة الاسبانية التقدم, والذين حصلوا على درجة اقل من درجة القطع agale‏ اعادة 
مساق الستوی التمهيدي لیتسنی لهم الانتقال الى الستوی التالي. وفي هذه الحالة لا يهتم 
الفاحص بدقة درجات النطاق الحسوية اکثر من توافقها مع أو دقة قرارات التصنیف التي 
اجراها القدرون: لتری هذا. آفترض أن جمیع الفحوصبن حصلوا على درجات نطاق تجاوزت 
درجة القطم للسيطرة وصنف الجمیع على انهم مسیطرون وذلك من خلال بیانات الاختبار. 
تخت ان درجة النطاق ودرجة التصنیف اللاحظة متوافقین فان دقة الدرجات الملاحظة کتقدیر 
لدرجات النطاق قد تکون غیرملائمة. 
اتساق القرار القدر باختبارین of‏ موقفین اختبارین: 

يهتم اتساق القرار بالدی الذي تعطي فيه قرارات متشابهة من خلال مجموعتین مختلفتین 
من القیاس. ویمکن ان يشير الاتساق الى ثطابق القرارات اعتماداً على صیفتین للاختبار أو 
تطبیقین مختلفین للاختبار نفسه. ویشکل أولي سنری في هذا الفصل توضیح عند استخدام 
صيغتين اختباریتین. على سبیل الثال: تطبیق صيغتين مختلفتین على 100 مفحوص قد يؤدي 
الى النتائج المبينة في شكل (1-9). فعندما تكون نتائج كلا الصيغتين تؤشران بأن الفحوص 
صذف مسيطراًء فان القرارات لهذا الفحوص تكون متوافقة. والاحتمال الحسوب لاتساق 
قرار السيطرة هى ase‏ الفحوصین الذين صنفوا باتساق على انهم مسيطرين مقسوماً على 
عدد المقحوصين الكلي. وفي مثالنا كان اتساق قراز السيطرة ل 20 مفحوص, لذا قان 
الاحتمال الحسوب لاتساق تصنيف السيطرة يكون Pig‏ = 0.20 وعندما تكون نتائج كل 
صيغة تؤشر تصنيف غير مسيطر للمفحوص فان القرارات تكون متسقة ايضا ومن T‏ طالب 
كان اريعون فقط تصنيفهم باتساق على انهم غير مسیطرین, لذا فان الاحتمالية المحسوية 
لاتساق غير مسيطر 0.4=Po0‏ والاحتمالية للاتساق الكلي P= Pij + Poo ya‏ 


وفي مثالنا 2-۳ +4.-0.6 وبالتالي فإن %60 من المفحوصين كان تصنيفهم متسقاً. 





بسي ان مومسم تيه tman bey‏ 
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وفقد اقترح هامبلتون ونوقيك (1973) P‏ على انها مقياس لاتساق القرار. والتصنيفات 


القرار العتمد على الصيقة 1 


القرار المعتمث 
على ال 





0.3 = Po; 0.7 = Pio 


شكل (1-9):احتمالات اتساق التصنيف لصيفتين اختباریتان 
الاخرى جميعها سواء أكانت (مسيطر- غير مسيطر) أو (غير مسيطر - مسیطر) هي قرارات 
غين متسقة والاحتمالية القدرة التضنيف غير التوافق هی: 
=P - 1‏ 0.4 


العوامل المؤثرة في اتساق القرارات: 

هنالك اربعة عوامل تؤثر في اتساق القرار: 

1/ طول الاختبار. 

2/ موقع درجة القطع على توزيع الدرجات. 

3 تعمیم درجة الاختبار. 

4 تشابه التوزیع لدرجات صيغتي الاختبار. 

لتوضیح تأثیر هذه العوامل على احتمالية اتساق القرار سنعرض تتائج بیانات افتراضية 
لصيغتى اختبار متبادلتین " درجات الاختبار للصیغ التبادلة لها التوزیم نفسه والعلاقة 
متوازية تماماًء ولکن التوازية تماماً لیس من الضروري ان تکون متبادلة). وعلی الرغم من ان 
نتائج جدول )2-9( تصنف صيغتي اختبار متبادلتین الا ان الاتجاه العام يطبق على الصیغ 
المتكافئة العشوائية ویبین الجدول )2-9( قيمة (أ): احتمالية اتساق القرار لصيغفتي اختبار 


=== 7 





























مقف من حدس فقزات: واخر مؤلف من )10( فقرات. مع تدوين قيم P‏ لعدة درجات ممكنة لكل 
طول اختباري . ویوضح جدول )2-9( Lal‏ انه ولزوج الصيغ الاختبارية يميل قرار الاتساق 
لان يكون اقل عندما تكون درجة القطع اقرب الى مركز توزيع درجات الاختبارء وفي جدول -2) 
(9 كان متوسط النسبة المثوية للاجابة الصحيحة- 0.4 لكلا الصيغتين , والاقل في اتساق 
القرار كان لدرجة قطع = 0.4 : ويوضح جدول (2-9): آثر التغير في درجة القطع وطول 
الاختبار على Pols‏ (اتساق القرار): ويبين الجدول ايضا ان امكانية التعميم تزداد بزيادة 





(A)‏ : متوسط درجة النسبة المكوية للاجابة الصحيحة= 0.40 لكلا الاختبارين 

(H. المعامل 02 هو مريع الارتباط بين الدرجة الملاحظة ودرجة النطاق لكلا الصیفتین؛ مقتبس عن هونیه‎ (b) 

Hunyh)‏ . الحساب والاستدلال لكلا معاملي الثبات في اختبار السيطرة كان بالاعتماد على نموذج ثنائي 

الجد - بيتا + 
طول الاختبارء وهذه تؤثر فى زيادة اتساق القرار وتؤدي زيادة طول الاختبار إلى زيادة في 
اتساق القرار ودرجات لقيم درجات القطع الاريع جميعهاء الا أن الزيادة ليست نفسها لكل 
درجات القطع. واتجاه الزيادة الاکیر یکون لدرجات القطع الاکیر ولکنها لا تعمم لواقف 
لخری. ویمکننا استنتاج ان مدی تأثیر طول الاختبار علی اتساق القرار یعتمد على الموقف 

والنتائج البنية في جدول )2-9( لكل طول LEAN‏ اذ تشیر كل من”م ودرجات القطع الى 

مجموعة لها متوسط قيمته 0 لكل صيغةء ولكن تباين درجات النطاق وبالتالي امكانية تعميم 
مشایه للاتجاه فى ote‏ )2-9( فاردیاد امكانية التعمیم یمیل لزيادة اتساق القرار لذا فان 
صيغتين للاختبار تمیل لانتاج قرارات ASÍ‏ اتساقا لمجموعة تتمیز بدرجات نطاق غير 
متجانسة SS}‏ مما هو لجموعة درجات نطاقها متجانسة. 





m, ey va,‏ اينالا 
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(a)‏ : درجة القطع معبر عنها عل متصل الدرجات الكلي = 3 لدخلات الجدول جميعها 

(D)‏ : يشير العامل 02 الى مریع الارتباط بين الدرجات الملاحظة ودرجات النطاق لكلا الصيغتين . مقتبس 

H. Hunyh . Computation and inference for two reliability indices in mastery عن‎ 

testing based on the beta- binomial model, in Hungh & J.C. saunders. Solutions for 

some technical problems in domain - referenced mastery testing (Final Report, Pro- 

ject NIE.G. 78- 0087). National institute of Education department of Health Educa- 
tion, and welfare. Adapted by permission. 


وهذا مبین یشکل وام في السطر الأول اذ یزداد اتساق القرار من الیمین الى الیسار 
بازدیاد تباين درجات نطاق المفصوصين. ایضا من المتمل لاتساق القرار ان یکون اقل 
لجموعة تتمیز بامكانية تعمیسم اکبر لدرجاتهاء وهذا مبین في السطر الثاني من جدول -3) 
(9. ويبين هذا الجدول ایضا أن P‏ تميل لان تکون اقل لجموعة متوسط درجاتها اقرب الى 
درجة القطع وکما هو مبين بنتائج کل عمود, ففي کل عمود كان اتساق القرار اقل للمجموعة 
الذکورة بالسطر الاول اکثر مما هو للم جموعة في السطر الثاني. وحسب هذه النتائج 
بافتراض درجة قطع 3 نقاط على تدریج الدرجة الخام. فکل مجموعة في السطر الاول لها 
متوسط درجات = 3 . في حين کل مجموعة في السطر الثاني كان لها متوسط درجات = 48 
وضمن العمود کان اتساق القرار اقل للمجموعة في السطر الاول Sf‏ أن متوسطها كان اقرب 
الى Los‏ القطم. ویبین جدول (3-9) ایضا ان اتساق قرار اساسي Sag‏ ان یظهر حتی 
Leste‏ یکون امكانية تعمیم الدرجات منضفض, وهذا مين في العسود الاول من الجدول. 
فالمجموعة ذات مخوسط 48 كان ما نضبقه 977 من القرارات متشبقا حتی عندما كانت 
امكانية تعمیم الدرجات منخفضة legs‏ ماء وظهر هذا لان معظم الدرجات كانت أعلى من درجة 
القطع على کل صيغة, لذلك فان معظم القرارات متساوية مع قران السيطرة. ويمكن تبیان انه 
اذا كانت الدرجات متبادلة. فان اقل قيمة محتملة ل م = 0.5 وهذه القيمة تظهر عندما تکون 
درجة القطع تقم على وسیط التوزیع والارتباط بین الصیفتین التبادلتین = صفر وعامل اخر 
يؤثر في اتساق القرار هو التشابه بين توزیعات درجات اختبار كلا الصیفتین, وعندما 





= 9 
























































تتساوى الاشياء الاخرى فان اتساق القرار يميل لان يكون اقل عندما لا تتشابه توزيعات 
ذخات ERES‏ 

وقد اجريت اقتراحات عديدة في الدراسات لتحويل ۳ الى قياس اكثر قابلية للتفسير 
لاتساق القرار. اثنان من هذه التحويلات مبينة في هذا الجزءء وبدلا من محاولة تفضيل احدى 
التحويلات على الاخرى نقترح انهما طريقتان بسيطتان ومختلفتان في تحويل P‏ لذا فان 
العاملات الجديدة يعبر عنها على تدريجات عليها بعض النقاط. 

وقد اقترح كل من سوا ميناثان وهامبلتون (Swaminathan; Humbelton & Algina, Laai g‏ 
)1974 استخدام معامل LIS‏ لكوهين: ش 


يم 
Poci‏ 


=k 





حيث ترمز ۲ الى الفرصة المحتملة لاتساق القرارء وهو ان الاحتمالية للموقف الافتراضي 
الذي تكون فيه الدرجات على الصيغتين مستقلة احصائياء ويشار اليه احياناً على انه اتساق 
الصدفة. وبحسب استخدام الصيغة Pog × Pog + Port Pio =P,‏ « ففي هذا التعبير Pg‏ تمثل 
احتمالية تصنيف مسيطر على احدى الصيغ و Poy‏ تمثل احتمالية تصنيف السيطرة على الصيغة 
الاخرى وكذلك تصنيف Pog‏ تمثل احتمالية غير مسيطر على كلا الصیختین . ولبيانات جدول 
)1-9( فان Pio‏ = 05 , روط > 0.3, وو = 0.5 ,و ۳0,07 x 0.5 + 0.3 X0.5‏ 07 = 0.5 
Poo‏ = وهذا يعنى ان %50 من القرارات تكون متسقة حتى عندما تكون درجات صيغتى 
الاختبار مستقلة احصائیا وك jus‏ اناق اش على اند قط pols‏ کک ان 
الکم الفعلي من الاتساق اللاحظ على كلا الصيغتين والقام في K‏ و 1-6 يمثل اقصی 
زيادة ممكنة في اتساق القرار اعلي وأدنى من اتساق الصدقة. ویمثل البسط  - Po‏ الزيادة 


الفعلية عن اتساق الصدفة. لذا فانه يمكن تفسیر K‏ على انها الزيادة في اتساق القرار الذي ‏ 


توفره القرارات اکثر من الصدفة العبر عنها على انها الزيادة المكنة في اتساق القرار على 
اتساق الصدفة. ویکون العامل =k‏ صفر عندما لا یکون هنالك Baby‏ و1.0 عندما یکون هناك 


اقصى زيادة ممكنة. ولبیانات شکل (1-9) فان - گت رن » اي بزيادة %20 
05-1 1 


من الزيادة الكلية المحتملة اكثر من اتساق الصدفة تم ملاحظتها للقرارات المعتمدة على كلا 














ويجب ملاحظة ان = صفر لا تعني ان القرارات غير متسقة ولا تستحق الاهتمام. ويمكن 
تفسير =K‏ صفر على انها لا اتساق اكثر مما يعتمد على درجات اختبار مستقلة احصائياء 
وقد يكون هذا الاتساق اساسيء تذكر انه لصيغتي الاختبار المتبادلتين يكون على الاقل %50 

من القرارات متسقة. كذلك فان 1-1 يمكن تفسيرها لتعني ان القرارات متسقة كتلك المعتمدة 
على درجات غير مستقلة احصائيا. ويمكن افتراض قيم سالبة KA‏ لتناظر الوقف الذي تكون 
ف علاقة عكسية مين درجات کلا الصیفتین . 

في البداية اشرنا الى انه وعندما تکون الصیفتین متبادلتین فان اقل احتمالية لا تساق 
القرار تکون 0.5 وهذه القيمة الاقل ستظهر فیما لو كانت درجات الصیغتین مستقلة احصائيا 
وکانت درجة القطم تقع على وسيط التوزیع الخاص بالصيغتين واعتمادا على هذه القيمة 


K کبدیل ل‎ P* الاقل, د نستخدم‎ 
(5 9( aaa 1- 2P = 0.5 -P = p* 
0.5 - 


ومثل oe K‏ لتعني ان القرارات متسقة مثل تلك التي تعتمد على اختبارات 
غير مستقلة احصائياً تماماً. وتساوي PP‏ صقر عندما تكون القرارات ليست اكثر اتساقا مما 
لو كانت درجات الاختبارات مستقلة احصائياً من تلك التي لها التوزيع نفسه لكل صيغة 
ودرجة قطع مساوية لوسيط توزيع الدرجات. ويجب ملاحظة ان PP‏ قد تكون سالبة 
عندما ايكون توزيع درجات الاختبار A Pat een‏ . ولبيانات شكل (l: D‏ 


العوامل المؤثرة في P*a K‏ 


مثل5: احتمالية اتساق OL all‏ فان كل من P*‏ و K‏ تتأثران بامكانية تعميم درجات 
الاختبار» وموقع نقطة القطع على توزيع الدرجات وتشابه التوزيعات والجدولين (4-9) و 
)5-9( يبينان قيم *۳ و K‏ للمواقف نفسها المستخدمة في الجدولين (2-9) و )3-9( . فالجدول 
)4-9( يبين الاثر على Py K‏ لتغير طول الاختبار على إمكانية تعميم درجات الاختبار وتغير 
درجة القطع. وهذه النتائج هي للمفحوصين أنفسهم. والجدول )5-9( يبين الاثر على × و*۴. 
لتغير تركيب المجموعة على امكانية تعميم المدرجات وموقع درجة القطع في توزيع درجات 
الاختبار. ونخلص بالقول الى ان P*‏ تتأثر تماما بالطريقة نفسها التى تتأثر بها -P‏ ويميل 
المعامل *2 لان يكون اقل عندما تكون درجة القطع قريبة من متوسط التوزيع. وعلى الاغلب 
فان" تزداد بازياد امكانية التعميم لدرجات الاختبار ويميل 
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(a)‏ : متوسط درجة الاجابة الصحيحة - 0.4 وللاختبارات جميعها 
(b)‏ : المعامل 02 هو مريع الارتباط بين الدرجة الملاحظة ودرجة النطاق لكلا الصيختين (مقتبس عن تفس المرجع السابق). 


العامل K‏ لان يكون اکبر عندما تكون درجة القطع قريبة من مركز التوزيع وتزداد ايضا 
بازدياد امكانية تعميم درجات الاختبار. وفي ادبيات الوضوع ستجد نقاشاً حول اي المعاملين 
هو الانسب بدرجة اکبر. ووجهة نظرنا هي ان كلاهما طرائق بديلة لتفسير P‏ وعند فهم طبيعة 
التفسير فلا نفضل احداهما على الاخرى. 

جدول )5-9( : تأثير تغيير تركيب الجموعة على ثبات درجات”1 KOs‏ ومتوسطاتها: 





(a)‏ : درجه القطع معبر عنها على QM‏ الدرجة الكلية = 03 لمدخلات الجدول جمیمها: 
(b)‏ : امامل 02 يشير الي مريع الارتباط بين الدرجات الملاحظة ودرجات النطاق لكلا الصيغتين (مقتيس عن نفس المرجع 


السابق) 
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فکلاهما يميل للانحدار كلما بعد التشابه بين التوزيعين: فضلا عن ان 1 أو ۳۳ ۷ تصلا الحد 
العلوي الا اذا كانت احتمالات السيطرة وعدم سيطرة الهامشية هي نفسها لكلا الصيغتين. 
معاملات ليفنجستون وبرينات - كين :- 

ليس بعيداً اعتبرنا معالم اتساق القرار الذي يعالج تصنيفات غير المسيطر متساوية 
الجديةء افترض انه وعند درجة القطع 0.7 صنف المفحوص A‏ ودون اتساق باستخدام نسبة 
الاجابات الصحيحة وكانت 0.65 على احدى الصيغ و 0.75 على الاخرى. وصنف الفحوص 
B‏ دون اتساق بحصوله على درجات 0.20 و 0.90 « وعندما اراد مطور الاختبار ان يعكس 
مقدار فجوة التصنيف في الحكم على ثبات القرارات فان هنالك معاملين يفيدان في الحكم 
طورهما كل من ليفنجسستون(1972 (Livingston,‏ وبرينان وكين )1977 (Brenan & Kane,‏ . وقد 
قدم كل من برينان وكين معالجة اكثر أهمية (اساسية) لتطوير معاملات الاتساق هذه اكثر مما 
سنوفره هنا. تذكر أن توزيع الدرجات على الاختبارين متشابهةء ويعتمد اتساق القرار علي 
عاملین: امكانية تعميم درجات الاختبار وموقع درجة القطع على توزيع درجات الاختبار . 
علاوة على ذلك ومن الحدس يزداد اتساق القرار كلما يزداد كل من امكانية تعميم درجات 
الاختبار و / أى الفروق (المسافة) بين متوسطات درجات الاختبار ودرجات القطع. وتقاس هذه 
الخاصية بشكل مناسب ومحدد بوساطة معامل ليفنجستون » وكما يأتي: 


26. م‎ - 
(6 - 9( ل‎ aye es =k KD 


2): © - Ux ( + Op 


وتستخدم الرموز × و T‏ منذ ان طور ليفنجستون هذا المعامل في سياق النظرية التقليدية/ 
فقرات الاختباز. وحساب KAX , T)‏ سهل doe‏ فان توافر قياسين لكل مفحوص تستخدم 
الصنغة: 0 


~ 


A A A A A 
nC بط( هلا‎ © - Ly ( + 6۲ © \ 
E EN ا‎ € Hx) + ORE Ox Px ae ty 


۸ 


۸ 2 ۸ ۸ 
[ لوط + ) Ny - Uy’) 4 Ox] [2(n,e - Ux‏ 2[ 
وهنا يمثل اورم الارتباط بين درجات الصیفتین فق لا تمثل متوسط الدرجات الخام, ols‏ 
2(nj € - u, ) + (KR20) 02x‏ 


(Sistas ED E LO 
2(nj c- p ) + Ox 


= 3 














سس دز ا ةن وت 














کمثال فى بیانات جدول )1-9( وعند درجة قطع = 0.67 , فإن: 

210.67 x (6) - 2.9} + (0.80) 4.08 A 

0.85 = OTO FEO =k. XXT) 
2(0.67)(6) - 2.96 + 4.08 


ان العامل الذي يؤر على اتساق القرار kek‏ توزيع ota‏ كلا ا Latins‏ 
اتساق القرار ‘esl‏ يأخذ بعين الاعتبار ET‏ الفقرات. 
2 + رم - 26 
=M(C)‏ وله + (c- u)‏ 

مده + ) n/ (oe + 02:4 X(c - u‏ 
02 و o?e‏ في بداية الفصل ويشير الرمز M‏ إلى المتوسط 
j< =‏ ز Xp; snp ni/ Xp; pZ‏ وهي درجة الفرد P‏ على 
Xp;‏ أنه متوسط النسية الئرية للإجاية 


وقد تم تعريف الرموز oP‏ و 
الفقرة ae (i‏ آن نبین آن الوط الإجمالي 
الصحيحة للعينة. والمعادلة المناسبة لحساب M (C)‏ هي: 


OSes P(e- xp1 ) + Op MC) 
nj/ )026 + 02) +2) - Xp) + مدق‎ 


وعلى افتراض أن درجة القطع = 67.. فان تعويض البيانات في مثالنا يؤدي إلى : 


0.83 = 2(0.67 - 0.48) + 5 - MO) 
0.0273 + 2( 0.67 - 0.48) + 5 
eee A sMO: ولان‎ 


المعادلة (9- 6 مكافئة 


26 - xpL ( + و62‎ 
(1 1 9) ee 8 =K XXT) 


ny/ (62, + Ac - Xp) + op 
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ومقارنة بالعادلتین (10-9) و )11-9( نری انه عند حساب KAD‏ و felis M(C)‏ علی 
تحلیل التباین الثنائي» فإن الفرق الوحید بینهما وجود :2 في مقام .M(C)‏ وكنتيجة يجب 
أن تکون KAT)‏ أكبر من MC)‏ 


مقارنة (16205,1 و M(C)‏ و P‏ و P‏ 


آشرنا في البداية أنه یمکن تصور *۳ أداة لتفسیر p‏ وهذا لا ینطبق على KXT)‏ آو 
M(C)‏ فکیف بعدها سیختار مطور الاختبار۴ من جهة من جهة آخری K2),1(‏ لتقدیم 
مؤشرات لطبيعة الاختلاف Logis‏ سنقارن بين P‏ و (162026:۳ » کذلك سنقارن بالطريقة نفسها 
بين 2و M(C)‏ 


یمکن تحدید العامل ۴ بشکل اساسي علی gall‏ الاني: لأي مفحوص صنف باتساق اعط 
الدرجة أو القيمة 1 وللمفحوصین الذین صنفوا بغیر اتساق hef‏ الدرجة صفرء واجعل ¥ ترمز 
إلى التغیر الجدید, Py‏ هي مجموع قیم۷ مقسومة على أعلى قيمة ممكنة للمجموع والذي يتم 
الحصول عليه فقطا إذا كانت القرارات جمیعها مقسقة. وفي حساب (1620,7 فإن الدرچة. 

W هو متوسط‎ K2(X,T) وهي نفسها للقرارات جميعهاء ويسط‎ (nic- X) (njc- x) =w 
)6 - يبين جدول‎ P والقام هو آقصی قيمة ممكنة لهذا التوسط. ولتوضیح الفرق بين (152)36,1 و‎ 
بیانات افتراضية لثمانية مفحوصین على صیفتین اختباریتین لاختبار مولف من 11 فقرة.‎ 9) 
(c- x) فقرات. ويبين جدول )6-9( أمثلة على‎ V= nje وکانت درجة القطع لکلا صيغتي الاختبار‎ 
لاتساق القرار أو عدمه. ویبین الجدول ایضا قسیم کل من ¥ و . وحیث ان‎ (¢-x!) 


جدول (6-9): أمثلة على اتساق القرار أو علامة ٠‏ 
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P‏ تعتمد قيم كل من على إضافة الدرجة ۷ فإنه يمكن رؤية أن حساب28 : جميع القرارات 
المتسقة تعطي الوزن نفسه 1 ell ally MS‏ غير الأمنقة يها lsd‏ الوزن فة ۷ د 
صفر ويما أن K2),1(‏ تعتمد على قیملا فان الوزن المعطى للقرار يعتمد على اتساق القرار 
للم فحوص, بالإضافة إلى كم التشابه لدرجات المفحوصين على الصيغتين الاختبارين 
للمفحوص. على سبيل المثال: تم تصنيف المفحوصين 1,6 دون اتساق وكانت W‏ للمفحوص 
2 أكثر سلبية منها للمفحوص © إذ أن الفرق متطرف بين درجتي المفحوص D‏ وبصورة 
أساسية فان هذا يعني أنه عندما يحصل المفحوص على درجات متباعدة مثل 2 و 10 
وصنف الفحوص دون اتساق فإن عدم الاتساق هذا يكون جدياً أكثر مما هو لفحوص 
درجاته 6 و 8 وكان تصنيفه دون اتساق. ويجب أن يعتمد الاختيار بين P‏ ومعاملات ٤۶ (fis‏ 
(XT)‏ أو M(C)‏ على ما إذا وافق الفاحص على القيم المؤشر لها بمعامل القرارات 
المختلقة. 

ولطرح قضية كيفية تأثر (16206,1 و M(C)‏ بالتغيرات في درجة القطع» خذ على سبيل 
المثال: أحد الاختبارات المؤلف من 11 فقرة وتقدم له 8 مفحوصين المستخدم في المثال 
السایق. يقدم جدول )7-9( مصفوفة افتراضية لاستجاية الفرد- الفقرة على هذه الفقرات؛ 
بالإضافة إلى جدول )8-9( الذي يدون US‏ من KZX,T)‏ و MCC)‏ لهذه البيانات ولدرجات 
قطع عديدة إضافة إلى أن جدول )8-9( يدون تقديرات 8و USIP‏ صيغتي الاختبار 
ولدرجات القطع المختلفة وبشكل عام تشير النتائج إلى أن العاملات الأربع تتأثر بالطريقة 
نفسها مع التغير في درجة القطعء وكما بينا في السابق فإن >1 تتأثر بطريقة معاكسة للتغير 
بدرجة القطع. 
حسابات ‏ و K‏ في التطبيق الفرد: 

تطلب حساب 2 و 8 في المناقشة السابقة قياسين لكل مفحوص وقد قدم كل (Hunyhycys‏ 
)19764 و (Wilcox ,1981b) (Peng & Subkoviak, 1980) (Subkovia,1976)‏ طرد بقة لتطبیق واجد 
في حساب ۲و .K‏ وطريقة كل من هونيه وسيكوفياك تعتمد على النموذج ثنائي الحد الذي 
طوره كيتس )1962 (Keats & Lord,‏ ووصفه لورد ونوفيك (1968) بالتفصيل. ويجب ملاحظة أن 
كلا الطریقتین لحساب ‏ و K‏ لصيفة افتراضية ومتبادلة مع الاختبار الستخدم تستخدم في 
عملية جمع البیانات. وکما لوحظ من البداية فإذا كانت الصیفتین متبادلتین فإن درجات 
الصيغتين یکون لهما التوزیم نفسه والعلاقة نفسها مع درجة النطاق. وتعد التبادلیه صیفه 
أقوى للتکافق من التوازي التام. وإحدى مشکلات استخدام معاملات هو نية وسبکوفياك أنه 
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جدول )7-9( : مصفوفة الفرد- درجة الفقرة لتحليل تباین الفرد - الفقرة لثمانية مفحوصين على 11 فقرة 
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وفي القياس المحكي يكون امتمامنا بمعامل اتساق القرار للصيغة قيد الاستخدام وصيغة 
افتراضية متبادلة مع الصيغة الاصلية. فضلاً عن الاهتمام بشيء مثل قيمة معامل اتساق 
القرار لجميع الأزواج الممكنة من الاختبارات البينة بالعاينة العشوائية من نطاق الفقرات. ما 
الذي يؤثر في هذه الشکلة؟ بما أن القيمة المتوسطة عبر جميع ازواج الاختبارات أقل من 
القيمة نفسها لزوج الاختبارات التبادلة, يبدو أن هذه الطرائق تؤدي إلى تصور إيجابي لكنه 
زاف (غیر منطقي) لاتساق القرار. وقد یکون هذا صحيحاً عندما لا تؤخذ العوامل الآخری 
بعين الاعتبار ومشكلة آخری ممكنة مع هذه الطرائق تظهر عندما یستجیب الفحوصین 
جميعهم على الفقرات نفسهاء فإن استخدام نموذج ثنائي الحد يقتضي التساوي في صعوية 
الفقرات - وهذا متطلب لا يتحقق عملياً- وفشل تحقيق هذا الفرض يعني أن الطرائق تؤدي 
إلى قيم أقل من المحسوية لاتساق القرار لأي زوج من الاختيارات المتبادلة CHunyh&‏ 
Saunders, 1980)‏ لذا فإن أثر هاتين المشكلتين تلغي إحداهما الأخرى. 

وفى طرائق سبکوفياك وهونية» فان الأخيرة طورت بدرجة ST‏ فهي تسمح بتقدير الأخطاء 
المعيارية لكل من P‏ و .K‏ وكلا الطريقتين معقدة رياضياً اذا فلن نتعرض للتفاصيل الرياضية. 
وتتوافر قائمة من البرامج المحوسية لاستخدام طريقة هونية ومبينة في .(Hunyh, 1980a)‏ 
وتتضمن هذه الدراسة أيضاً جداول يمكن استخدامها في تحديد قيم K yp‏ لاختبارات عدد 
فقراتها ما بين 10-5. ولاستخدام هذه الجداول فمن الضروري معرفة u‏ 11821 » ودرجة 
القطع فقط. ويستخدم 21 على أنه ثيات درجات الاختبار الذي یتطایق مع النموذج ثنائي 
الحد. والنتائج التي دونها سبكوقياك )1978( تقترح أنه عند الاعتماد على عدد قليل من 
المفحوصين مثل العدد 3: فان طريقة هونية توفر تقديرات دقيقة عادلة ل ۶ Ky‏ للاختبارات 
المتوازية تماماً وتحتوي 10 فقرات على الأقل. 

وقدم كل من بينج وسبكوفياك )1980( تقريب بسيط لعمل هونيه وغير متحيز (عادل). خذ 
على سبيل المثال عند توافر مجموعتين من القياسات التي لها توزيعات اعتدالية متمائلة وله 
توزيع طبيعي ثنائى متصل Joint bivariate normal distribution‏ فمثل هذه الاختبارات 
تعد متبادلة, وهذه الحالة موضحة في الشكل (2-9). وعندما تكون توزيعات درجات الاختبار 
متشابهة يمكننا أن نبين أن : 











شكل )2-9( التوزيع الاعتدالی SUS‏ الحد. 
Poo) + 1 =P‏ -.2)20, لذا فان ات 
Poo) + 1 =P*‏ - .4)۳0. كذلك يمكن أن CaS‏ ان: 
x) Pr = Po. gly. 220. - Po.+ Po. - Poo =K‏ > عزه): احتمالية کون × اقل من 9:6 
على افتراض ان الدرجات موزعة عشوائياء لذا يمكن حساب po.‏ باستخدام : 


Hy - 6 
(T2 OY 2 van { هك‎ Pr =Po 





f 590 ی وین‎ HCO 
n;e و 10 و‎ <O. = Uy في التوزيع الط يعي. للتوضیمح, إذا كانت‎ 1 a ۳ 
_ nye 
1 em >Z} Pr= { njc> x} Pr = p0. فان‎ 60= 
x 
0.84 =f we >Z} =Pr 


والآن: فان Poo‏ هی احتمالية کون الدرجات على كلا الصيغتين اقل من 9:6» أو بشكل يديل 

آن Us‏ التغیرین الطبیعیین العیاریین العشوائین اقل ye‏ سک . وهذه الاحتمالية یمکن 
NYC My‏ 

إيجادها من جداول التوزیع الطبيعي العياري ثنائي التغیر (Gupta,1963)‏ شريطة کون 

الارتباط بين التغیرین معروف. وهنا یکون الارتباط هو معامل الثبات العرف بنظرية القیاس 


== 9 



































ين الارتباط بين ا ولتوضيح حساب 
0.4=KR21 1‏ 


حسایه. ولتقريب طريقة هونيه يستخدم 
كدالة ل ,۰2 حيث Ox /(UX- npc) = Z‏ 
كلا من *م و K‏ أفترض أن اختبار مؤلف من 7 فقرات. =O; 9 4.5 = HX‏ 
se aa ac aie‏ الدرجات الرائية» فإن: 


4.5-5 Ayn 
ae ار‎ 3 








~ >Z} Pr = Po. 


z) pr =‏ >0.5( = 0.69 
جدول (9-9): احتمالية ارتباط متغيرين اعتدالين معياريين الارتباط بينهما آقل gi‏ يساوي Z‏ 

















وللحصول علی۳00 في مثالنا نستخدم جدول )9-9( وپاستخدام Ox 1 ۳ - fie =Z‏ 


4.5 -5 
0.4-KR21,. 0.5 = . 





0.36 = (0.69 - 0.53) 4 + 1 = P+ 


2 5 
0.25 = 0.69 - 0.53 _ k 


20.69 - 0.69 


دقة القرار: 

أحد الاستخدامات الرئيسة للاختبارات محكية المرجع هو اتخاذ قرارات تتعلق بمستويات 
كفاءة الملفحوصين ففي العديد من الولايات يعطى طلبة المدارس العليا الدبلوما بعد اجتياز 
days‏ محددة في اختبار wall‏ الادنی من الکفاءق Minimum Competency Examina-‏ 
ction‏ وفي المعاهد التريوية العليا يتم قسکین الطلبة في صفوف عادية أو علاجية أو متميزة 
اعتماداً على درجاتهم في اختبار محكي المرجع. فعندما نستخدم درجات الاختبار بهذه 
الطريقة فان dol‏ مقاییس نوعية الاختبار هو Gs‏ القرارات ااك ple‏ اشامن هذه الدرجات 
(کتمییز لها عن اتساق القرارات الناجمة عن تکرار العملية الاختباریة). آفترض أننا نعرف 
قيمة Hp‏ درجة النطاق لكل مفحوص, نحدد Lasas‏ درجة القطع على متصل Lays‏ النطاق, 
ویعد هنا کل من كانت درجته تساوي) أو أكبر منها مسیطراً على مجال المعرفةء والذین 
درجاتهم أقل منها یعدوا غير مسیطرین على الجال أفترض أيضاً أن الاختیار محكي الرجع 
طبق على الفحوصین جمیعهم لتصنیفهم إلى فئتين الاولی مسیطرین والآخرى غير مسیطرین» 
فالفحوصین الذین درجاتهم عند days‏ القطع © أو أعلى منها هم السیطرین والذین درجاتهم 
أدنى منها هم غير السیطرین» ویمثل الشکل (3-9) مثل هذا القرار. (الفرق بين الشکلین (9- 
1( و (3-9) هو أن الاسبق يشير إلى العلاقة بين القرارات المأخوذة باستخدام درجات 
اختبارية ملاحظة Lasse‏ اثنتان ومختلفتان» والأخير يشير إلى العلاقة بين القرارات المأخوذة 
باستخدام درجة اختبار daly‏ وهذا يتم إجراؤه فيما لو تمت معرفة درجات النطاق). 


ويالتمحيص لشکل (3-9) يتبين لنا أن هنالك نوعية من القرارات الصائبة ine sig‏ من 
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القرارات الخاطئة (غير الصائبة) المحتملة لكل مفحوص. فالقرارات الصائبة هي القرارات 
الصحيحة الوجبة والصحيحة السالبة. فالقرار tl cal‏ الوجب یظهر Leste‏ نف 
الفحوص السیطر من خلال درجة النطاق ویکون التصتیف صحيحاًء يرمز لاحتمالية القرار 
الصائب الایجابی ب ورظ. . بینما القرار الصائب السليي یظهر عندما يكون القحوص غير 
مسیطر من خلال درجة النطاق ومصنف غير مسیطر على اساس درجة الاختبار. واحتمالية 
هذا القرار يرمز لها ب Poo‏ ویتف حص شکل )3-9( يظهر Lal‏ أن هنالك نوعین من 


التصنيف بناء على درجة النطاق 


06 = Po- 


0.4 = Pio 





0.5 =p. 0.5 = Po 


شكل (3-9): احتمالية التوافق بين تصنيف درجة النطاق ودرجة الاختبار. 
القرارات غير الصائبة (الخاطئة) قد تظهر. فالقرار الخاطئ الإيجابي يظهر عندما يصنف 
الفحوص غير السیطر من خلال درجة النطاق على انه مسيطر من خلال درجة الاختبار 
ويرمز لاحتمالية هذا القرار بالرمز Pio‏ والقرار الخاطئ السلبي يظهر عندما يكون المفحوص 
مسيطر من خلال درجة النطاق ویضنف على انه غير مسيطر من خلال درجة الاختبار» وهذه 
الاحتمالية يرمز لها Poy‏ ومن الواضح أن العلومات المعطاة من خلال هذه الاحتمالات تفيد في 
تقویم الاختبار محكي الرجم. على سبیل ا SABI) Pe‏ 
الصائب)» ويعد مقیاس طبيعي لعدم دقة القرار. ولبیانات شکل (3-9): فإن: 
م - 4و + 07-03 لذا فان فان 9670 من القرارات تکون صانبة. 


ولتقویم درجة دقة القرار لاختبار معين بدرجة قطع dies‏ يجب حساب احتمالية ظهور کل 
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م emer,‏ مت تور صم 


Seven ey اللي ليس‎ 











من القرار الخاطئ الايجابي, والقرار الخاطئ السلبي. وقد قدم ويلكوكس(177110,19772) 
عدة طرائق لحساب Pig‏ و Poy‏ : احتمالات أخطاء التصنيف: الخطأ السلبي والخطأ الإيجابي 
على التوالي, وتستخدم إحدى هذه الطرائق النموذج ثنائي الحد. وقد زودنا هونيه (Hunyh,‏ 
(19808 بجداول مك استخدانها لتق هت الطريقة لاخدا رات Zales‏ مق ففرات iê‏ 
من )10-5(« وکذلك زودنا ببرنامج محوسب یستخدم هذه الطريقة لحساب تقديرات ى 
Poy‏ لاختبار يصل عدد فقراته إلى60 فقرة. وطور ویلکوکس طريقة آخری یمکن إجراؤها 
يدوياً شريطة استخدام جداول تحویلات الاقترانات الدائرية (ARC SIN)‏ وجداول التوزیم 
الطبيعي الثنائي (وهذه الطريقة تجدها واضحة في الجزء الرابع من (19778 (wilcox,‏ ومع آ 
كلا الطریقتین طورتا لحساب Pio‏ و ۴۵1 الا أنه يمكن استخدامها في حساب P10‏ و Pog‏ 
وستجد مناقشة إضافية إثرائية لطرائق تقویم دقة القرار للاختبارات محكية الرجم في 
الفصل 18(اعداد jules‏ الاختبار). 
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درجة دقة الرار تب معن ل درجة قطع معت یچب حساب | احتمالات. ae‏ 
تس sasas‏ طرائق ق یمکن استجدامها في saa a‏ ه الحسابات 









التمارین: 





أ) ما tha‏ التباین الحسوب لجموعة | لبیانات وپاستخدام الصيفة (1-9). 


ب) ما hall‏ العياري للقیاس. 
ج) ما اقصی قيمة محتملة للخطا العياري للقیاس لهذه البیانات. 


على قيمة معامل R20) laff‏ والنتائج مدونة آدناه. 
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أ ) ما معامل إمكانية التعميم لحساب قيم درجات النطاق لهؤلاء الفحوصین. 
ب) هل يؤشر هذا المعامل إلى آن درجات النطاق تمثل بدقة درجة الإجابة الصحيحة 
الملاحظة على هذا الاختيار. ` ۱ 
5 إذا كان هذا العامل =1 فما درجة النطاق الصحيحة للمفحوصين 1 2. 3. 
0 افترض أن الفاحص اهتم بالقاضلة عبر المفحوصين من خلال درجات نطاقهم. ما 
صيغة معامل إمكانية التعميم المناسب بدلالة متوسط المريعات. 
(a‏ ما قيمة معامل إمكانية التعميم الحسوب باستخدام الصيغة الستخدمة في الفرع 
f3‏ 
و) هل يمكن حساب هذه القيمة بطريقة أخرى؟ ما هي؟ 
3/ افترض البيانات أدناه التي تشير إلى الدرجة الكلية التي حصل عليها الفحوصین في 
المشرف dita‏ أريع درجات نجاح ممكنة لهذا الاختیار هی: %60 (THe‏ 00ص 
da‏ نجاح مقترحة؟ 
ب) ما قيمة معامل (K) LIS‏ لكلا صيفتي الاختبار ولكل درجة قطع مقترحة؟ 
(z‏ ما قيمة p*‏ لکلا صيغتي الاختبار باستخدام كل درجة قطع مقترحة؟ 
د) لقيم كل من , Pek‏ وعند درجة قطع2060 الكتب تفسيراً لمعنى الإحصاءات 


الثلاثة هذه؟ 





Books 


Sole ;‏ شبات الاختيارات م 




















4 أ- عد إلى مصفوفة استجابة الفحوص- الفقرة المبينة في التمرين الأول والثاني. ما 
قيمة معامل ليفنجستون لهذا الاختبار عند درجة قطع 0.50؟ وعند درجة قطع 0.75؟ 
ayes‏ هت اباب دين كنت کون بقل لفات رفاح سكن لود انا 

مقارنة بتقديرات ليفنجستون؟ فسر تنبؤك؟ 
wa‏ احسب دلیل برنیان - کین لهذه البیانات باستخدام درجات قطع 0.50 ۰ 0.75 , 
علی التوالي. 
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لس راجع صيغة برنیان - كين معادلة 10-9: وبين أن كانت تزودنا ddas‏ لدقة القرار آو 
بحساب Gs‏ درجة النطاق عدل استجابتك. 
ه- فى اي الحالات یمکن اعتبار صيخة برنيان- كين على انها دلیل «معياري الرجع». 

i /5‏ لأهداف هذا التمرين أفترض أن الإحصاء الوصفى للاختبار (1 في تمرين 3) غير 

37 5 A 
لدرجة قطع النسبة الصحيحة‎ k متوافر, إضافة إلى افتراض أن ۶ = 0.4 احسب قيمة‎ 
075 
. اضات الضرورية اللازمة لطريقة الحساب التي اتبعتها‎ LY پ- ما‎ 

6 فى وصف اختبار الكفاءة القرائية الاساسي دون جانا بول )1980 (Gana pole,‏ 
لتاکید الثبات لدرجة آکبر لاختبار الكفاءة القرائية الأساسي استخدمت طريقة اتساق 
القرار لقارنات كل من: الاختبار - الإعادة والصيغة المكافئة. وحسب دلیل لكل من 
نسية الاتفاق بالنسية لستویات الكقاءة الثلانة: 0و %70 و ۰060 وقیم اتساق 
قرار الاختبار الإعادة للاختبارات الفرعية وتر اوحت بين 9027 إلى %88 للصيغة )1( 
ومن %37 إلى%90 للصيغة (ب). 

آ- فی القالة نفسهاء دون المؤلف تقديرات ثبات الاختبار - الإعادة على الصيغة (أ) 
وتراوحت بين 50 الى 1 اذا كانت هذه التقدیرات منخفضة بهذا الشکل. 

-~o‏ ما الأثر الحتمل لاتساق قرار الاختبار - الاعادة فیما لو ازداد طول الاختبارات 
الفرعية جميعها بخمس فقرات. 


5 افترض أن الصيغة () للاختبار طبقت على مجموعة مفحوصين درجات نطاقهم 
متجانسة Jia‏ كيف يتاثر دليل اتساق القرار لهذا العينة. 

st Sachs‏ لون SUSE‏ بدلا من ذلك دون اتساق القرار بدلالة *ص و Kء‏ فكيف 
يمكن مقارنة هذه القيم بتلك القيم الدونة؟ 
الدرجات عند النهاية العليا لمدى الدرجات المحتمل لكلا الموقفين في هذه الظروف 
ist‏ درجة قطع يكون دليل اتساق القرار أعلى؟ 
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eR‏ سدس سد 


الفصل العاشر 
مقدمةالى الصدق 

تستخدم الدرجات عادة للحصول على استنتاجات عن سلوك المفحوصين فيما وراء العملية 
الاختبارية. فمثلاً في اختبار علوم للصف الثامن» ومقياس التمركز حول الذات لطفل مرحلة 
ما قبل الدرسة. واختبار المحاماة للولاية» يهدف الفاحص فى الحالات جميعها الحصول على 
استدلال من خلال درجة الاختبار على نطاق أكبر من السلوكات التي يمك 
الفحوص الآن أو في المستقبل. ويتطلب الاستخدام المسؤول لدرجات الاختبار من مستخدمها 
أن يكون قادراً على تعديل الاستدلالات التى حصل عليهاء وذلك بأن يكون لديه حجة مقنعة 
لاستخدام درجات الاختبار للهدف الحالي, ولاختياره لهذا الاختبار وتفضيله على طرائق 
التقییم الأخرى التوافرة )1981 (Messick,‏ ومثل هذه التعدیلات لها متطلبین سابقان هما: 
ثبات درجات الاختبار وصدقها. فعامل الثبات الکبیر يشير إلى اتساق درجات المفحوصين, 
ولکنها لا تؤكد استدلالات عن الفحوصین پمکن الدفاع عنها. آفترض مثلاً التشابه الجزتي 
في خزان وقود السيارة والذي یسجل بانتظام 4/1 زيادة عن الستوی الفعلي للوقود في 
الخزان. وعندما JAG‏ قیاسات متكررة تحت نفس الشروط فان القیاسات تکون متسقة (أي 
ثابتة)» ولکن هذا الاستدلال عن الوقود والخزان خاطی» لذا نری آن دلیل كنات القیاس قد لا 
یکون كافياً لتعدیل الاستنتاج الرغوب. 





وقد وصف کرونیاخ )1971 (Cronbach,‏ الصدق على أنه العملية التي يجمع مطور الاختبار 
أن مستخدمه من خلالها الاذلة التى تدهم الاستدلالات التی استخلصها من درچات الاختبار. 
تجريبية لجمع الأدلة اللازمة للائمة وفائدة الدرجات لثل هذا الاستنتاج. وهنالك ثلاثة أنواع 
من الدراسات الرئيسية للصدق هی: 

1( صدق الحتوی Content Validation‏ فعندما يرغب مطور الاختبار الوصول إلى 
ات سای من خلال و الک هن على كان اکر EE Go‏ الشانية اترات 
الاختبار نقسه. 

2( الصدق الرتبط Criterion related Validation: dao:‏ ویستخدم في الواقف التي 
برقا تشم ible gayle‏ الحصول ole‏ انشا هاه واه الات مره درت 
الوص هی انار هن سارکاته ad past‏ له اح Aid‏ 
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س ہہ ہہ سم معا بمب سوسیا ویس سامت اك 








3( صدق البناء : Construct Validation‏ وهذا عندما لا يكون هنالك نطاق أو محك متفق 
عليه مناسب للمحتوی لتحديد نوعية ما يراد قیاسه (Cronbach - 5 Mehi,1955)‏ 
ویرغب مطور الاختبار إجراء استدلالات من خلال درجات الاختبار على الأداء الذي 

وعند اختیار اختبار لهدف معین. فعلی مستخدم الاختبار التأکد من أن له أدلة صدق 

مناسبة للاستخدام القصود في هذا الوقف. وعندما لا بقدم ناشر الاختبار أدلة صدق 
للاختبار ویعتقد مستخدم الاختبار أن الاختبار له فائدة ممكنة فعلیه إجراء دراسة صدق 
محلية قد تصمم وثجری من قبل مستخدم الاختبار. کذلك فان آنواع دراسات الصدق الختلفة 
تدعم آنواع الاستدلالات الختلفة لذاء يجب اعتبارها متبادلة. وأخيراً فان تعدیل بعض 
الاستنتاجات یتطلب آکثر من نوع daly‏ من دراسات الصدق. 


صدق المحتوى: 

تهدف دراسة صدق الحتوی تقییم ما إذا كانت الفقرات تمثل نطاق الاداء أو البناء 
الستهدف بشكل مناسپ. فمثلا. فى اختبار الالفاظ نادراً ما يهدف مستخم الاختبار ما 1a)‏ 
كان المفحوص يعرف معاني کلمات محددة فقط ولکنه يهتم بمعرفة الفحوص بالکلمات 
Gaus, ay AGN‏ تسوت alls‏ ربق مان من تدك مت بن AA‏ 
الستقلین (غیر كتبة الفقرات) للحکم على ما إذا كانت عينة الفقرات مناسبة لنطاق القیاس 
ویدعی مطور الاختبار أحياناً أن GUS‏ الفقرات من نطاق محدد بدقة SSi‏ صدق الحتوی. 
وا هلاقن رات وی مر ine teil aah‏ بلكل قتا لانت 
تناها بحن اكه كيل الوا ماه کزان ییاد وه الانكطة psy ad‏ سور 
اقاي تیه سدق آ ارت على الأول الخاد کید 

1( تحديد نطاق الأداء المستخدم. 

2( اختیار فریق من ol wall‏ الزهلین في مجال النطاق, 

3) التزوید بهیکل بنائي لعملية مطابقة الفقرات لنطاق الأداء. 

4) به Gana‏ اا العامة ع میا اک رد 


ولان صدق الحتوی يستخدم عموماً مع اختبارات التحصیل( فان نطاق الاداء يحدد عادة 


)1( . في السبعینات كان هنالك اهتماماً ملحوظاً في صدق الحتوی للاختبارات الستخدمة في اختیار للستخدمین, وهنالك 
درأسات مهمة طورت في هذ! السیاق, فقد ترغب في مراجعة بعضهاء (Brien, 1977) Sa.‏ و )1975 (Gavin,; (Lawsh,‏ 
)1977 وذلك لمناقشة صدق المحتوى في سياق اختبارات الشخصية. 











(SAM ab peel fine, ETEL] 


pi‏ دوک s Laaj‏ سے سے ماه 7 ی “E‏ ولاه 
© مت alge‏ ام © Fat‏ مزا وو دیک ےس غ Tiss d‏ 


من خلال قائمة أ الأهداف التعليمية. "ومع ذلك نحن Sa‏ ر الطرائق الأخرى الستخدمة فيا 
7 لیرمز إلى أي قائمة من lS pla!‏ أو فئات السلوك التي يستخدمها E‏ الاختیار آو 
مستخد مه في وصف النطاق. 
اعتبارات عملية في صدق ren‏ 
یتطلب التخطیط لدراسة صدق الحتوی sal‏ اك العملية asi‏ 5 
1) هل تم موازنة الأهداف لتعكس أهميتها؟ بأحدى al‏ الشائعة شي ال قيمة از وزن 
متساو aS‏ اف المدرجة جمیعها. وجهة النظر شذة غير شاملة» وافترح کات (1958 (Katz,‏ وزن 


ا 
أو ترئیب الأهداف حسب آهمیتها قبل المزاوجة بين الأهداف col Sally‏ واقترح كلين وكوزكوف . || 


(Klein & Kosecoff, 1975)‏ تقدير أهمية كل هدف على متصل مؤلف من خمس نقاط ودون 
ممت ةا يبيب ee‏ 
الحاجة إلى تقديرات مطلقة من قبل الخبراء الذين حكموا الفقرات فى عملية الوازنة. كمثال 
w etaran‏ 
في مدارس المقاطعات الكبيرة يمكن الحصول على الأوزان النسبية للأهداف المختلفة من 
خلال اشتراك معلمي المقاطعة جميعاء مع أن عينة أقل بكثير اشتركت Wad‏ في Lage‏ المطابقة 
بين الفقرة والهدف ونقطة آخری يجب مراعاتها هي طبيعة التعليمات التي أعطت للخبراء 
الذين طلب منهم تقدير أهمية الأهداف. كمثال في الحكم على أهمية الأهداف التدريسية فقد 
dat‏ آحد الدرسین الوقت الستغرق في الیش كك وآخر قد suas‏ الأهمية النسبية من 













3 
لك ب و و tls‏ نوس لمشتل ا )یس ae‏ ,\ مود چا ری aL, wl SS‏ ۸ ا 








الخيراء پتعریف مشترك متفة علیه للاممية لا استخدام الأحكام الخاصة SIG‏ المحكمين ۱ 

la‏ > لمات ےا کی 

(الخبراء). + ۳ الما بم D — a9‏ دب قثت حو سم ae es‏ 
١ Veta‏ دالمطا Pa‏ سب الورش و الفقراى A‏ رشح اله 


و ا Sule‏ ا سلوب فعال یکمن في إرشاد الخبراء 
للتقدم بانتظام عبر الاختبار بمزاوجة كل فقرة إلى قائمة الأهداف. وقد اقترح کل من كاتز 
(Katz, 1985)‏ وایبل )1956 (Ebel,‏ أن يقرأ الخبیر الفقرات قراءة تصور EIEI ERN‏ 
اا وقد الي ی ا ون ی ی 
المزاوجة وهئ: " ا | 

LS Bi لفق ات كل و انض وت‎ UES 

= مقائنة كل فرع إلى ANT‏ 


- تسجيل نتاج قرار المزاوجة بصيغة معيارية. 


ال : 293 — 
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Ba we 5‏ 
9 س هه N‏ ر <a‏ 
ا 
كذلك وصف هاملت ن )1980 (Hambelton,‏ طريقة تقدير درجة الزاوجة دين الفقرة وألهدف 
الحدد باستخدام تدريج خماسي النقاط تشير فيه النقطة (1) إلى درجة مزاوجة ضعيفة (5) 


إلى درجة مزاوجة ممتازة. ويحسب وسط أو وسيط التقديرات المزاوجة الكلية بين الفقرة 
والهدف. 

~ 3) ما هي مظاهر الفقرة التي يجب فحصها؛ يجب تزويد الحكام بوصف واضح لخصائص 
aai‏ والنطاق لیاخنها بعين الاعتبار في عملية مزاوجة الفقرات مع النطاق. وبعض 
الخصائص المهمة: الوضوع. والعمليات af‏ بستوی تعقيد الأداء المطلوبء بالإضافة 





إلى نموذج الاستجابة المطلوب. وعلى سبيل JEN‏ خذ أهداف الرياضيات الآتية للصف الأول: 
ea‏ ا 


1- جمع آي عددين موجيين مجموعها 18 أو أقل. 

ب- طرح أي عددين (قيمة كل منهما أقل من 20) وناتج الطرح قيمة موجبة. ويحتوي 
الشكل )1-10( عينة فقرات يمكن أن تستخدم لتقییم ASH‏ في هذا النطاق. فالفقرة 
(1) تتزاوج مع الهدف of‏ والفقرات (۰2 3) تتزاوج مع الهدف بء والفقرة (4) تتعلق 

7 بموضوع ليس من محتوى الهدفین, والفقرة تتطلب مستوى آداء lef‏ من المتضمن 

بالأهداف إذ آنها تتطلب الجمع بين الهارات المطلوية للهدفين المنفصلين لحل مشكلة 

۱ واحدة. ۱ 1 
وحتی عندما یکون محتوی الفقرة والعملية مناسبین للنطاق, فإن أسلوب أو شکل العرض 
قد يؤدي إلى استفسار الخبراء عما إذا كانت الفقرات تطابق الجال أو النطاق. فعلی سبیل 
المثال يمكن اعتبار الفقرات (من 1 إلى 3( فى الشكل (10- 1) غير ملائمة لمنهاج تدريس فيه 
مشكلات الجمع والطرح بصيغة عمودية وليست خطية كما Bll‏ في الشكل. وأحيانا يتل 

نموذج"العرض من المفخوصين تمثيل,بلوكات إضافية خارج النطاق المستهدفء مثل سوال 6 

في الشکل (10- 1(« إذ يتطلب قدرة المفحوصين على القراءة فيما لو تم حل السالة بشكل 

صحيح. ومثل هذه الفقرة لا تمثل نطاق مهارات الجمع والطرح الأساسية نوفووة: واخیرا 
يجب أن يؤخذ بعين الاعتبار طبيعة الاستجابة المطلوية من الفحوص, فاختبار القراءة والكتابة 
يبد أنها تمثل نطاقات أداء مختلفة نوعاً ماء وذلك GY‏ طبيعة الاستجابة المطلوية مختلفة مع أن 

الفقرات sf)‏ المثيرات) تبدو متشابهة في كلا الموقفين. 
حالما يتم بناء الاختبنار فإنه يجب سؤال الخبراء عن خصائص الفقرات (نوقشت في . 

الفصل 4). والحكم على مدى تحقيق الفقرات لهذه الخصائص. ومع أن هذه المهمة غير 


متحيزة إلا أنها تتضمن المرحلة الأولى فقط من عملية ثنائية المزحلة. ومن الضروري أيضأ 


5 =5 +3 -1 ` 





ی ی ا Ramen cy s teap‏ سیا | ا اسه Tea‏ 


Maanam, na mtg m a رگ از‎ E. s a عد نام‎ 











SS = 5- 8 3 

SRE = 16-25 -4 

20 =5-3+13 -5 

6- لدی جودي 6 بنسات. أضاعت منها بنسین. فكم بقي معها: 
2.4 

ب. 8 

ج. 10 

د. 12 


شكل (1-10): مسائل توضيحية - نوقشت في صدق المحتوى في اختبار رياضيات للصف الأول الأساسي. 


يجب أن يكون الحتوی» ومستوی التعقید» وصيغة السوال (المثير) وصيغة الاستجابة مناسب 
rst ee ۱ FA Le g 77 ۰‏ 8 
PE gp BF es‏ 
4( كيف يحب تلخيص سین : أن hs all‏ عما آذا کانت مجموعه ة الفقرات تمثل النطاق 
کک ر 
lawl‏ بشکل مناسب يعد قراراً نوغياً اکثر منه كسا pags‏ النظر فان العاملات الكمية 
لتلخیص قرارات الحکام على الفقرات منفردةً قد تکون مفيدة. وتتضمن بعض العاملات 


EIAN‏ کمن 
a 7‏ 
َة للآهداف. n‏ 


ES‏ ; 7 الب د ا 


$ I بان‎ ilay < 
Ei .Kosecoff, 1975) 

Vel & Kobe 1977) الفقرة 5 والهدف‎ 58 (sal gall د- ميعامل‎ 

ه- نسبة الأهداف التي لم تقيم بأي.فقرة في الاختبار. : l‏ 

ولان a‏ 0000 أعلاه تعتمد على Larne‏ “فلا يوجد ا 


کی ار 
ee‏ 


اع © لمك يبي 


35 
































5سا" 























وعند تفسير النتائج. فمثلاً يتطلب كلا العاملین الأول والثانئ عند:کبیر:من:الفقنات )100 أو 








أكشر) التفسیر ذي العنی. ويتاثر الخامل الثالث بتباین عدد شترا اث د التي تقیم کل E‏ 
وأوزانها النسبية. وتحديداً لو أعطيت e‏ بتتنتاوية آو آنها قیست 


جميعاً بعدک من الفقرات متسای, فإن قيفة معامل الارتباط هذا = 


والعامل الرایع الذي اقترح من قبل )1980 (Hambelton,‏ هامبلتون و هاميلتون وروفنيلي 
(Hambelton & Revenelli, 1977)‏ يمكن استخدامه لتقييخ إلى أي مدى is cig‏ صدق 
مجتوی فقرة معينة بالنسبة Legal‏ الاهداف. وتعتمد هذه الصيغة على افتراض أنه في 
الحالة الفالية يجب أن تزاوج النقرة هدفاً foal,‏ ققط من مجموعة الأهداف» وتعکس igh‏ 
جمع البیانات هذا الافتراض وذلك لانه تم توجیه.الخبزاء لمزاوجة.الفقزة لكل Sb GAA‏ يعطوا 
القيمة (1) فیما لى SaS‏ نالك مزاوجة والقيمة ضفر إن لم يكن متاكدا من اا وال 
(-1) فیما لولم تتطابق الفقرة م الهاف بُوضوح. ويمكن حساب معامل توافق الفقرة مع 





° بالصيغة‎ K الهدف‎ 
)1-10( ۰ )۳ - Wy) = Tx 
2n-1 


۰ 0 ا‎ age ترمز نا إلى عد ی إلى متوسط تقدير‎ dus 





á oa‏ فإن ذ نسية"الأهدافه غين:المغطاة مت 
تمقيل منختوی النظاقبالكلي:موؤسناطة:: fhe paii‏ قاقزنات هذه. لاحظ أنه فى الحالة المتطرفة 
عندما تتطابق فقرات الاختبار جمیعها مع واحد فقط من الأهداف المهمة فان المعاملات 








الأخرى تکون عالية dae‏ ولکن یکون هذا العامل منخفضاً لذا فانه یقدم معلومات مختلفة 
اساسا . ویجب تفسیر معامل التناسب هذا عندما یکون عدد الأهداف التي یقیسها الاختبار 
> اروص کے راہطا ۵ من pK‏ حل مها ا تعر و Saal‏ 
۰ ووها+ سم الى zd‏ 

AWS ی کشصیتا و درم شرا لإصلات‎ fos 





)+( الصيغة القدمة هنا هي صيفة مبسطة للصيفة التي قدمها هامبلتون )1980( وهامبلتون وروقنيلي )1977( معایل 


هچ زره 
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اش ا ا سور a Ga‏ اال سهد 














س س LIRR inte STI tame MRE an‏ امب قله NOT ee! see a‏ وميه 


قضايا في تقييم صدق المحتوى: 

إحدى المشكلات الرئيسة الرتبطة بصدق المحتوى هو إمكانية المزاوجة بين الفقرات 
الأهداف بشكل جید. الا أن الأهداف المكتوية لا تمثل نطاق الأداء بشکل مناسب والذى 
ف مستخدم الاختبار إجراء استدلالات عنه. وقد اقترح کرونیاخ )1971 (Cronback,‏ 









جية لعلاج هذه المشكلة تسمی مضاعفة تجرية الیناء "Duplicate Constrnchion‏ 
0 التي تتم باستخدام فريقين مستقلين من مطوري الاختبارات لاجراء ee‏ 
لمحتوى نفسهء وأسس تجريب الفقرات ومحك تفسنیر البيانات» ثم يطلب من كل فريق تطوير ۱« 
اختبار لنطاق محدد مثل 'معرفة وضع آداة نقل رموز الحركة' وبعد تطوير الاختبارين 
تطبيقها على اللفحوصين_نفسهم يحسب متوسط مريعات الفروق لدرجات الاختبارين. 
وباستخدام نظرية الدرجة الحقيقية التقليدي: = 
X2 &‏ & _ 
N‏ 

حيث Ky Ky‏ هي الدرجات على صيغتي الاختبار التوازیین, و0621 و و062 تباين الخطأ 
لصيغتي الاختبار (وإثبات هذا سيترك تمريناً للقارئ في نهاية الفصل) ويمكن حساب تباين 
الخطاً لصيغتي الاختبار بطرائق الاتساق الداخليء لذا فإن النسبة تحسب باستخدام المعاينة 
الإحصائية الذي sales‏ على مفحوصين عددهم N‏ 








0e2 + Oe] 





]079 جوم 2ه 

n / 2-5‏ 
وعند اقتراب هذه الفسبة من (1) فإنها تشير إلى أن الاختبارين المبنيّين من قبل الفريقين 
الستفلن متشابهان امن خلال تبانن AUN‏ وكما كو Jili‏ 3 الاخقيان امهزا عة 












وا اا کو ال ری تقول جد أن ای مدن الک ےار بعلي 
CaN‏ فقزات الاختيار للنطاق eal‏ ومن مه ادا کم کیت تماق ع itp gd‏ 


=== 7 






































= القصصية في الحوانيق رم رضن N‏ الانجليزية JURY‏ فتتحدثین 
بالأسبانية. وهنا لا يمكن الوصول إلى استنتاج دقيق من خلال درجات الاختبار حول 
المهارات الحسابية للمفحوصين. وظهرت المشكلة في هذا الوقف الفعلي لأن خصائص النطاق 
غير ملائمة وادت إلى نتائع غير ملائمة. ومن الواضح أن النطاق هو القدرة على حل مشكلات 
قصصية معروضة باللغة الإنجليزية باستخدام مهارات رياضية sre‏ وتبقی درجات glial‏ 
تمتلك صدق محتوى لهذا النطاق الأكثر تخصيصاً. السؤال هل هو مجدياً محاولة وصف آداء 
مفحوصين معيئين فى ذلك النطاق. ومثل هذا السؤال يعد قضية تربوية لا سيكومتريةء لذلك 
فان القرارات الاکش عمومية يمكن إجراءها باستهداع”هذا Obey LEAN‏ تكون sages‏ 
الاختبارات حساسين للخصائص الأساسية للمفحوصين لین ج طب متهم الجاع في SY‏ 
كمتطلب سابق, وتضمين هؤلاء عند وصف نطاق السلو 

قضية أخرى هي ما إذا كانت بيانات الأداء TT ARES aL‏ أخذها بعين 
الاغتبار عند الحكم على Gare‏ الحتوی, تتبنى كرونياخ من جهة (۳:455 ,1971( موقف "لا 
شيء في منطق صدق المحتوى يتطلب أن يكون النطاق أو المجال متجانساً في المحتوى. 
فالفقرات ذات الارتباطات الداخلية الأكبر قد تمثل زيادة معاينة لمجموعة فرعية معينة من 
السلوكات الموجودة في النطاق". ومن جهة أخرى يبدو غير منطقي توقع أن الفقرات المطابقة 
للهدف نفسه تكون ارتباطاتها على الأقل متوسطة. ومع ذلك مثل هذه البيانات قد لا يكون 
دليلاً كافياً لصدق المحتوى (Glee si)‏ وهي بالتأكيد أدلة مهمة لملائمة النطاق (أى غيابه)» 
وهی بالتاكيد أدلة مهمة للائمة النطاق المحدد وعملية صدق المحتوى. NU‏ وجد أن الفقرات 
التي تم الحكم عليها أنها مطابقة للهدف نفسه غير مرتبطة عملي هنا تكون العملية التي تم 
من خلالها مطابقة الفقرات والأهداف, ونوعية الفقرات وملائمة صياغة الأهداف معرضة 
للمسائلة. 





. أخيراً. م اس Side e‏ مضي تعرض من وقت ae‏ یی 
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سد سمل و سینت aana‏ معي رس ببسيس وبيب تمس و 








agal‏ عندما يتبين آن.الاختپار يقيس His‏ معنوياً أو Lage‏ ومفهومين آخرين جدیتین في 
الأصل هما ضدق النهاج Giras‏ التدريس (انظر 1978 و (McClung‏ .يشير الأول إلى مدى 
مناسية الفقرات لاهداف منهاج. معین كما وضعت فيالبسایق» والاخیر يشير الي مدی تقدیم 
المعلع تدرب یش المجتوي | الخاهن ن والمهاراد ات المقيسة بفقی ات الاختبار. 

وقد ناقش كل من يالى ويويام (1983 0 & (Yalow‏ ظهور هذه المفاهيم بالنسبة 
لصدق الحتوی والدور الذي تلعبه في قرارات المحكمة الحديثة في الولايات والمستخدمة 


لحقوق الولايات فى الحصول على ديلوما عالياً اعتماداً على درجات التحصيل الاختبارية. 








الصدق المرتبط يمحك:” ' 





يزب الشرف على القبول في ji‏ و سل رجات ضار شرا الا 
الأكاديمي في مساق عملي في الكلية. أو قد يرغب أن يستخلص ومن خلال درجات الاختبار 
حجم المبيعات للذين طبق عليهم الاختبار وفي مواقف البيع التي یشظونها, وقبل استخدام 
درجات الاختبار لاتخاذ قرارات حول القبول أو التشغيل يجب أن يحصل صان القرار علي 
ادلة فشين إلى أن هنالك علاقة بين درجات الاختبار والأذاء على الحك فهذا النوع من PU:‏ 
كن الخال هاه مز را gana‏ ربتعم 








والصدق geet eae‏ نی ۱ پشیر ان eer sb Sah faut‏ المي 


الدرسي GAT)‏ ممتويد TEN‏ درجة درجة الطالب بالك a‏ 0 ی stasi AB g‏ اختبار 


nr‏ یہ يب at‏ ی سی 
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لس كه جم سرا زارت السهونت "مله ALI!‏ 
Wy ay‏ ا fot al ge‏ رنب مع 
وهذا الدليل على الصيدق ليزي فد الأساس في تعديل استخدام درجات ت اختبار الاستعداد 
بالتلامیذ الذین یتجحوا في GEN‏ وان ن (CGPA)‏ يعد اسا cel TA‏ الاكاديمي, 
ويسبب العلاقة المثبتة بين (SAT)‏ و (CGPA)‏ فان استخدام درجات ٩7‏ في قر 1 
نحن تعديلها جزئیاً على الاقل لحمل استتتاجات حول أداء ا ۳ چس 
ين إلى العلاقة بين درجات. Se‏ ي الوقت co‏ 





۱ ان لاختبار‎ mem ییپل امثال إذا تقدم | التدرب‎ Nhe 








a 59 eee 0 ۱ =‏ یفن Coe ETT‏ 
مشكلات تطبيقية ii Guat‏ قبط پمال e ee ey‏ 
هنالك عدة مشكلات ت محتملة قد 3 تؤثز في Zeal ys‏ | ات تييع er‏ لتقو 
عه في تحديد الحم الناسب. یت كفاية i‏ العينة. » والتلويث, وقيود as, one‏ 
a‏ ثورندایك )1949 , ee‏ الی ن ا الحك PER Kas‏ ها 














dabai ssi ان‎ tesa te oe Cd sce ag 

الحکات ليست LG‏ بدرجة كافية أو مهمة لاستخدامها کمحك منفرد لتصدیق أختيان هم 

للتنبق بالاداء علي للجال انیب بالقايل ینمیز الممك . الكل بي على الأغلب بأنه ذو آهمية 
PR‏ 3 





وسيلحظ القارج أن اذه اكات عبارة عن بناءات فعلية يجب تحديدها إجرائياً بی وساطة 
متغيرات يمكن قياسها بصورة مباشرة بدرجة آکبر. 


اه Es‏ 
على سبيل. a‏ أن hlel 0 Siac! bai‏ معلمي الستقيل الصفيء 

































ب 90 وفي السنوات الأخيرة توجد توقعات قانونية وه WERN‏ ۳ 
الاختبارات ومستخدمیها لاثبات وبرهنة صدق درجات اختبار في الاختبار الشخصي أو 
التربوي في كل مکان عمل خاص أو تربوي تستخدم فيه الاختبارات, لذلك وضمن الفترة 
الزمنية العقولة لاجراء دراسة الصدق, قد یکون هنالك فريقاً من الستخدمین في الؤسسات ۰ 
الخاصة والعاهد التربوية والذي یکون صغیراً إلى الحد الذي پسمح بتقدیر مناسب لعامل 
الصدق. وفي مثل هذه الحالات قد يكون التحقق من تعمیم صدق المتنبيء بديل لاجراء دراسة 
الوق S ped Daas‏ وخلك tees‏ تراساث Gara‏ الرقیط يجنا وااو في 
الدراسات لتنبيء بعينة أى المتنبآت المشابهة والحکات الشابهة للمحك الیتخم في الوقف . || 
wl / E‏ ها د we‏ عم غیج اماب paali‏ نب ۲ Vs sA‏ ما لحت ]له 


اک هریم st‏ اا 





sft at 
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الاختبار ودرجات ‘ne sya.‏ ا با 32 متا کون مساو 


فيما لو كان أت oles‏ الأستاذ لاعتبار الطلبة الذين حصلى على درجات عالية في اختبار x heal‏ 
be ۳ ۱ : ; ia‏ م c‏ 











































أنهم بارعون:وبالتالنبیزی: gelan‏ :فصل مما 
قل من العلاقة بين atl‏ والحك فيما لی علم تا 













a‏ استخداج 


eh‏ ا ‘cet‏ ی ۳ 3 Tami = cya‏ له 
و بمیم الافراد الذي 2 





ai y LA M دمي ,في‎ 
È Lol e 8 
cor aes E 


0 الاختيار eal‏ على ذلك المتغير. كذلك فان التباين علنى المتنبيء قد يختصر SESS)‏ 
قيما لو تم الاختيان: ا على اسان مته اه موقط بالأخديان aeaa‏ 
عندما نيتم إجراء دراسة صدق لاختبار القبول في الكلية. ولكن خلال إجراء الدراسة تم قبول 

* “الطلبة بناء على أساس درجاتهم المدرسية والتي ترتبط بدرجاتهم على اختبار القبول وهذا ما 

يعرف بالاختبار العرضي. 









الح a‏ رة(مثلاً عندما gis ie ene aT ies‏ بم مولف oye‏ ا تقاط فی 


اتاج الجا سب واه 


i ice ieee‏ ی الطبيعي 


OS of |‏ 2 
أ اتید الدی hela‏ عندما,یغایر الطلية 


(al. مه مصدراً‎ | i 





عمر مبنتين» وتونم أن العديد من JULY Nia.‏ 1 أن e‏ القوي هو آلاقل يسيب 
قسوة ظروفهم لیعیشوا إلى العمر الذي سیتم فيه الحصول على بیانات الحك. 

وقد ناقش کل من فورندايك )1982,1949 (Thorndike,‏ وجو لیکسن (lord novick,‏ 
Gulliksen,1968)‏ طرائق حساب معاملات الصدق للمجموعة الكلية حتی عند الحصول على 
بیانات كاملة على المتنبيء في حين أن بيانات التغیر الحك متوافرة فقط لجموعة فرعية 





r 
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mempana mmn a r سا یس‎ 


| E سی و ل‎ ee 








ختارة من المفحوصين بسبب الصعویات التي يواجهونها في دراسة الصدق. وتتطلب هذه 
إلطرائق افتراضات قد لا يمكن الدفاع عنها في المواقف العملية. وأحد هذه الافتراضات أن 
الانحدار الخطي ل ل (المتغير المحك) على X‏ (المتنبيء) هي نفسها عبر قيم X‏ جميعهاء وهو 
للمجموعات المختارة وغير المختارة. افتراض آخر هو أن Oxy?‏ (تباين المحك للمفحوصين عند 
أي نقطة معطاة (KJ‏ هي نفسها لجميع قيم ×. وقد لاحظ لورد ونوفيك )1968( أن الأخطاء 
فى تصحيع معاملات الصدق قد لا تظهر فیما لو آهملت هذه الافتراضات خاصة عندما لا 
یکون الاختیار واضحاً على درجات التنبیء. کخلاصة من الافضل التخطیط لدراسةلصدق 
aia al‏ تقلیص ای اختصار التباین آن كان ممکناً بزلا من الاعتماه على طرائق التصحیم 
الإحصائي في التغلب على هذه المشكلة 


هيات آلتتبی- وانحد. 

يبدى من المنطق في أي محاولة تقد On iaaa Heya:‏ :اجك gaiho‏ 

دكين انلها سكن وفي الواق says‏ علاقة مباشرة “x eer‏ وثیات کل 

من ا ؟ والعك مثل: 

يرم = \ حورم \ “روم l‏ ...)2-10( 

وإذا حصلنا على تقديرات ثبات التنبيء و المحك وكانت 0.8120 Pyy\s‏ =0.64 
, يمكننا حساب أقصى ارتباط يمكن الحصول عليه بين هذه المتغيرات ويساوي 72.0 وسيتم 
عرض لاشتقاق هذه العلاقة ومضامينها في تفسير نتائج دراسبات الصدق. ويعد كافياً لغاية 
الآن ملاحظة أهمية جمم الملاحظات لكلا من المتنبيء والحك وضمن ظروف تقلل أخطاء 
القياس لأقصى قدر ممكن» وكذلك فحص ثبات كل من المتنبيء والمحك. (وفي بعض الأمثلة 
النادرة سنلاحظ أن الارتباط بين × و Pyh Polat Y‏ ويظهر هذا Leste‏ يكون تقد 
الثبات آقل من تقدير معامل الدقة لأحد أو كلا المتغيرين ای عتما لا شحف فرضية AER‏ 
ALS ou‏ علي OO‏ 

ومع ذلك فمن المرغوب به الحصول على قياسات ذات ثبات عالية لكلا من الاختبار والمحك» 
culls‏ من الضبروري صجة القول Gly‏ القوة. التنبؤية للاختبار:تزداد بازدياد الاتساق :الداخلي. 
ويمكن إيجاد مناقشة أوسع لهذا في لوفنجر )1954 (Loevinger,‏ ولورد ونوفيك (Lords Novick,‏ 
(1968وايبل )1968 (Ebd,‏ و هورن )1968 (Horn,‏ وكين )1982 (Kane,‏ باختصار نلاحظ أنه كلما 
كان الاختبار المتنبيء أكثر تجانساً في المحتوي (بزيادة الاتساق الداخلي) فان الارتباط بين 











303 


































































ص س 


salle = Jl) ارتباط‎ A 


۲ = 

58 . العم دس 

Ol o. CA ie‏ يناس SS‏ اعد د 
(cee age an co‏ 

wad Mae يکام ايلك لل يقد‎ Rate 

he ST east الك‎ ys 

aif! 5‏ ین 7 ر جو 

mS‏ سید 









معط 
لحك ولکن 0 فيما e 1946). AR‏ خذ مثلاً الثال 
Uae ala‏ الوق من فقر فقرتين عندما يكون الارتباط بين الفقرتین = 1.0 ففي هذه الحالة 
تؤدي الفقرة الثانية إلى زيادة تباين المحك والذي لا يعزي إلى الفقرة الأولى. وهذا التناقض 
في زيادة الاتساق الداخلي في الوقت الذي ينخفض فيه الصدق ولد قضية ستؤخذ بعين 
الاعتبار في الفصل ٠.14‏ 7 
تدوی نکثائج الصدق المرتبط بمحك وتفسيرها: 
يمكن تحلیل البيآنآت المتجمعة من دراسة الصدق الرتبط بمحك بعدة طرائق, فإن كا 
قياس الحك على توزیم متصل فإن معامل ارتباط بیرسون بين درجات الاختبار وقیاس الحك 
يمكن حسابه, وهذا ا عليه Jala pl‏ الد الصيق. . وقي بعض eel‏ آن یکون 


sateen 


0 في علم | النفس التحليلي ا أو الفشل في إک إكمال م ‘sti.‏ النجاح 

REEDS tall 
وفي هذه الحالة فإن متوسط درجة المتنبئ للناجحين يمكن مقارنته بمتوسط درجات الذين‎ 
لم ينجحواء والفرق بين درجة اختبار القبول والنجاح أو الفشل في نهاية البرنامج (كبديل:‎ 
:)14 الى وضدت في فصل‎ VoL atl A ath عفی رآ‎ la sek الطرائق الأرسباطية‎ 
tell راسپ على‎ - ee) ينم تصنیف الدء على کل من الین والحك‎ Lost 
اأظويقة»ارتياطية‎ ETSE 3 ڪن‎ 


وقد لا يكون معامل الارتباط بين درجات الاختیار والمحك كافياً لساعدة مطوري الاختبار 
في الحكم على مستخدميه درجات الاختبار لاحتياجاتهم الخاصة. ومن العلومات الإضافية 

aor e EUT E E ES 
ies pele el SESS دراسةآلصق‎ et التي قد تدعم مد مستخدمي الإختبار في شش شوب‎ 


يستخدم في تفسير أهمية سای متكي أي ودي ى معامل الارتباط بين درجة 









eee ا بعزی الى تباین الآداء على الاختبار‎ AREI من لتباین ف في‎ %36 gji 
وعندما تستخدم درجات الاختبار للتنبق بالأداء المحكي للأفراد فمن المهم تدوين الخطاً‎ 
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صب او ل REET EA,‏ 


+ نمسا مس كسم هه ل 
| كر فض 


بو هه 


و یکا AUS sod‏ لامرك 


العياري للتقدیر والناقش في فصل 2 تذکر آن معادلة التنیژ بدرچة الفرد و علی التغیر الك 
هي: 
My + (lÊ x - x) (x | dy) Pry =y!‏ 
Payot E‏ ترمز إلى معامل ee‏ و by‏ تتإمز للانحراف المعياري على درجات المحك, 
زان إلى التوسط والانحراف المعياري على 
المتنبئ المحسوب من عينة دراسة الصدق. fla Ay‏ فترة الثقة حول الدرجة النتبا بها الفرد 


ی 












G 


واستخدم الاختبار الذي حدد قيم الا المحسوية لذ 
Louie‏ تكون درجة ۷ الفعلية تقع فى الفترة التقريبية 
y‏ الفعلية في الفترة التقريبية ی (ومثال 
مبين في فصل 2ء اتظر معادلة 2 - 20). 

أخيراًء فى تفسير مدی دقة درجات الاختبار 
الاختبار او العف فف یقیر الها استخدام حول 
لدف dye all TAL‏ ی ی على الاح 
في جدول (1-10). ۱ 

وفي هذا الثال استخدمت استبانة مهارات الهنة للتتبق بالاداء الوظيقي للطلبة العاملین في 
برنامع تدریب القوة البشرية والعدد في کل خلية يذل علی نسبة التدربین لكل مستوی درجة 
في استبانة مهارات الهنة والذین آرسلت إليهم توصیات الشرف (الحك) مبين في راس 
الجدول. ویمکن تفسیر القیم البينة في الجدول على gall‏ الآتي: 


جدول (1-10): جدول توقع يبين نسبة التدربین في كل فئة درجات عند مستویات مختلفة: 


هن تمکن آن تکون بیو POS AE‏ 
en‏ %95 435 عندما تقع days‏ 


0 ضمن مدى درجات معين في 
والذى يتضمن احتمالات درجات 


المتنبئ. ومثل جداول التوقع هذه مبين 
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مر a‏ فاد عت الوك سياه عر et a‏ 

















at 


























المتدرب الذي تقع درجته في المدى160-151 على استبانة مهارات المهنة فرصته %3.8 لا 
تکوم us‏ اه مستتكدما أ أعلى من مستوى الدخول وفرصته %5.1 OF‏ كو تما die‏ 
آدنی مستوی للدخول وفرصة 9034.6 GY‏ یکون مستخدماً في الامتحان الصارم. وفرصة 
0 لان یکون غير مستخدم. ۱ 
9 ولعظم الاستخدامات التحليلية والترپوية والشخصية فان درجات اختبار واحد تکون 
Leb,‏ غير ÉNEK‏ لاتخان ۰ قرارات مهمة حول المفحوصين آلنفردين .وقي حالة تحدید vals‏ أو 
أكثر من المتثيآت الفيدة» فان سؤال الصدق يكون» هو ما ذا أمكن للمتنبىء الجديد أن يؤدي 
إلى تطویر بل ged‏ تحسین التتبق بالاداء المحكي عند أضافته للمتنبآت الأخرى. والطرائق 
الإحصائية لاو NESTE‏ السؤال مطروح في فصل 11. ویناقش الفصل 12 اعتبارات آخری 
مهمة في تفسیر معلومات الصدق والذي يتعلق بقرارات الاختیار. 
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چ tenn‏ پپپ n‏ بسي te‏ = .ر Samanta‏ ەر 











Se Lge 
صدق البناء: ا اي رک‎ 
can 


0 فى الفطرل | الأول,اسيتخيما ها الأبنية النفسية كأساس في تطوير الاختبارات. وحدد 
البناء داف السو اتف آلعلمي, وفكرة طورت لتسمح بالتصنيف والوصف لبعض 
Ta UI ma‏ بشکل هاش ولا يكن ملاحظة GLY‏ النفسية ساشترة ن WAY‏ على 
الابنية النفسية الذکاء» والابداع» والاستقلال عن الجال, والانبساط -الانطواء. وقد لاحظ لورد 
ونوفيك )1968( انه من الأهمية بمکان تحدید البناء فى مستوین: الأول يجب تعريفة اجرائياً 
(أى تحديده لغوياً)» ويكون عادة بتخصيص الطرائق الستخدمة في قياس البناء. ED‏ وه علي 
الاختبارات مثل اختبار ستانفورد-بينييه, واختبار عزل المترابطات» واختبار تفهم الموضوع, 
وجميع هذه توضح التعريفات ttle‏ ئية لأبنية مسماة, بالاضافة إلى آن | البناء eal‏ يتطلب 





هم مختلفين في البناء المراد اجراء دراسة صدق له. وهذه الفرضيات يجب أن تعتمد 
على نظرية صیاغتها واضحة ویقع «Lull‏ ضمنها > وتزودنا بتعريف خصوصي لليناء. 


تفنسين النتاجات الملاحظة (opr‏ 
إن أمكن). 
ويجب أن يكون واضحاً من القائمة السابقة أن صندق درجات الاختبار يصدق الاه 
حول طبيعة البناء الذي نهتم به لا يمكن الفصل بينهماء ؛ وان كانت العلاقة الفترضة. eit‏ کت 








شبات يها slid, ball‏ كلا من البناء والاختبار الذي پقیسه مفیدآ. وان لم هنکن من Lil‏ 
موخ مت مودو مضو د مسد سس 


bite‏ سوه 





131 tree Ea n ance سدق حو حو ووو سل‎ te ددم‎ TANTRA: 


== 7 















































فک ا stall‏ اا do‏ أو الاختياء الذي يقد یتیس gh‏ کلاهما. (في هذه ۳ البناء 
وت راان عل کل من النظرية و والاختبار الذي يفيس الیناء والذي يحب بناءوه 








يشبه نوعاً 
هيدا قزل ان الق من تيل المديكر مقو الان 
طرائق للصدق البنائي: 

يتطلب صدق البناء تجميع وتصنيف أنواع عديدة من الادلة أكثر من أي أسلوب صدق 
الارتباط بين مقياس للبناء والمقياس المصمم: 

مثال تقليدي هو محاولة تسیر t‏ أدلة أرتياطية للعلاقة ons‏ نيعاد اجتبارات الذكاء 


ومقاييس ARGI‏ أء الدرسي آو الوظيفي. . ومع أنه یبدو så‏ ر 
- إلا أنه يمكن الموافقة 







الشترك وهکذا... ومثل هذه العلومات لوحدها ليست كافية دون القارنة مع مدى القيم الدونة 
طابقا و ال د Ge:‏ لس ا بو ا ومزل هذه 





العدید pit as ere‏ لوب ee‏ تطبيق الانحدار 
مساهمة البناء الهدف في التباین على الحك نسبة إلى مساهمة التغیرات الاخری (وهذه 
ستناقش في الفصل 11). كذلك اقترح دارلنفتون )1970 (Darlingtone,‏ طريقة یفترض فيها 
سار الاكتيان قينا ells as‏ بين ای Mel‏ والتفیرات الأخرى اللاحظة من أجل 

تأسيس أدلة حول صدق اليناء. 





التمییز بین المجموعات: 

مثال علی هذا الاسلیب مقارنة متوسط درجات النکور والاناث على مقیاس التقدیر الذاتي 
ارات دور الجتس yal‏ ما آذا عاق ties‏ بالاتماه البو بالفرخنية والفشل فى ایجاد 
للیناء أو fis Lats‏ هذه الدراسات عبارة عن دراسات تجريبية من حیث التصمیم» وتهدف 
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أولئك الذين لم يتعرضوا للمعالجة. فان لم توجد فروقات في مثل هذه الدراسات فإن 
التفسيرات المحتملة هي فشل- فی | لنظرية وأو الینای ور آق عدم ملائفة الآداة في قباس 
g/Sa‏ قشل في العالجة. 


التحليل العاملي: 

تطلت gli ds‏ تن عام االتضول فى سمدوكة و اناك lain Gia‏ اتسين 
qa‏ :وكباب EE N‏ بي هذه الشاسات, وم فم Ji Slaw etal‏ 
Sb‏ لفك اقل هون بو el all‏ زو القن نمی عو امل ) ت انان فى مجو 
Nall!‏ الاصلیة. ویعوض الفضل 13 تفصیل قار التحلیل العاملی» ولکن هنالك عن 
ام E EE‏ ا ی متا gh a‏ اتصالة ای يت معان مسفرنه 
الارتباطات الداخلية للفقرات (عدد فقرات الأداة = (n‏ لتحدید ما إذا كانت الاستجابات على 
الفقرات تتجمع lee‏ في نمط معین يمكن Saali‏ به آو منطقي في ضوء الترکیب النظري للبناء 
لذي نهتم به. ویشکل تباین الاستجابات علی الفقرات تجمع یمکن أن ated‏ إلى التباین عبر 
peal‏ خان على عامل هارف ب ادان وه الجامل الك لا يمكن میا ashe‏ 
ا aah ca‏ ناسا فرع من خلان سوق تا مج SUSI‏ ارو ولاف 
هي ما إذا كانت الأبنية الحددة تجريبياً من خلال التحلیل العاملي مناظر للابنية النظرية التي 
اقتا مطور ا ها ا تطرير ا تفای نسيل phic JEN‏ اختار تسف 
الریاضیات(؟ إذا كانت الفقرات تتطلب تنفیذ حسابات رياضية بسيطة تجمعت في عامل 
واحد. وفقرات تتطلب حل مسائل AST‏ تعقيداً لشکلات بکلمات تجمعت في عامل آخرء فإن 
هذا قد یثبت توقع مطور الاختبار. وإذا تجمعت عدة فقرات وظهر أنها تقیس الشيء نفسه 
وال شقانن شيرب مه E erie‏ ی خامل yal‏ هذا مجر tual‏ حول bib‏ 
ینام القاس لهذا التچمم من الفقرات. وفی المنالة الاه يكن معاملا مخ ارتباطات 
مره ill aah al taal‏ متفه E‏ سد Al‏ فا e‏ اشرحان AS‏ 
ف alata‏ ان ری لقان عامل وة راح AS‏ زوا العضل 19 نكال 
مفصل لهذا النوع من صدق البناء من خلال التحلیل العاملي. وثانية, الق الحاسمة هي 


)3( قدم هذا JEM‏ على أنه توضيح مبسط. ولکن يجب ملاحظة أن التحلیل العاملي لاستجابات الفقرات الثنائية تظهر مشکلات 
نوقشت في الفصلین 13, 14. 
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ما إذا كانت الاختبارات الفرعية أو الاختبارات التي يفترض أنها تقيس البناء نفسه تم 


ها Laas‏ على انها تقس عاملا مكيتركا 


مصفوفة السمات الطرق المتعددة: 









طور کسامبل وفيسك )1959 (Campeli & Fiske,‏ هذا الأسلوت 
معط Mma Sind Lt)‏ 


الاختبارات کمقاییس للبناء لاملانمة يتام كما فی محدن هن ان البرا al‏ النظرية المتنبا 
بها والرقبطة پیقاییس بخامات[خیی. وني هذه التقنية يجب لدج لي et‏ 





we م لطب‎ 0 ites : Bees 


ما لام م Kany‏ اناه هم 


تحسب ب الارتباظات جين Steuer Ses‏ كل laa‏ ار ۱ أنه أحد ar‏ 
الثلاثة الآتية: 0 


a ce 


aR 5-7 EE 


caer‏ القارنة عير الانواع الختلفة من العاملات یتم ترتیب العاملات في اة 
السمات - الطرائق المتعددة مثل المبينة في جدول )2-10( والبيانات المعروضة في هذا 
الجدول تم تدوینها في دراسة موی ر(1968 (Mosher,‏ وتتعلق OM:‏ بناءات مختلفة Lalo)‏ 


تھا ام بو 


الشعور باثم الجنس Sexguilt‏ و والعد ات Hostility Guilt‏ وا Rew‏ الخلقي Morality,‏ 


و مو و 


وی ی ی هذه بعدة و - ee) TEN tha‏ والجیل 


~ 
+ وه در 


ا عبارة عن ارتباطات بين قياسات تستخدم الطريقة sag Gus‏ 


في السطور (2 1 إلى 2 ج) و (3 1 إلى 3 ج) معامل صد تجميعي وآحد في كل صف. ففي 

































صف 2: أ يمثل العامل )0.86( الارتباط بين قياس الشعور باثم الجنس القاس بطريقتي 
الصح - الخطأ والاختيار الإجباري. 

وفى كل صف من الصفوف الستة الدنيا casts‏ أن معاملات الصدق التجمیعی أكبر من 
معاسلات الصدق التمييزي, وبتوافر الادلة التي post‏ النظرية القترحة لأنواع الثم الخطفة. 
إضافة إلى أن القیم النسبية للارتباطات عبر السمات الختلفة تقم فى النمط نفسه في 7 من 9 
لثلثات السمات غير التجانستة. (وقد اقترح کل من کامیل وفیسك بصورة نمونجية نعط 
العلاقة نفسه عبر السمات يجب ملاحظته عبر الثلثات غير التجانسة جمیعها). ومع أن کامبل 
وفیسك آوصیا بالعاينة أو الفحص البصري لتقییم بیاناث صدق البناء في مثل هذه 
الصفوفة. والتی قد تکون مشکلة بسبب خط العاينة. وحدیاًء اقترحت طرائق تحليلية 
اضافیة قد ga‏ إلى ففسیرات اوعس tl‏ بیانات هذه الصفوفةء ولك لعینات آکبر 
بشکل ملحوظ. (انسظر على سبيل المثال: )1979 (Marsh and Hoce- s(Lomax & Algina,‏ 
(Schmitt ,1978( svar,1983)‏ 


فراع الك من Wa ga RN E‏ ادا ASU tS‏ قرو TIP fe‏ كيان jie‏ 
طرائق. القياس المختلفة. فقد اقترح كين )1982 (Kane,‏ التحقق من هذه النقطة من خلال عناصر 
حدول )10 -2):جدول توضيحي لییانات مصفوفة السمات - الطرائق المتحددة من دراسة موشیر(4). 





طريقة 1 طريقة 2 طريقة 3 
السمة ١‏ . ب .ج السمة أ. ب.ج السمة Í‏ باج 
1- صح - thd‏ 
أ- الشعور بالإثم الجنسي (0.95). 
teed n o ۱‏ " 
ب- العدائية 8 )0.86( eto"‏ 
ج- الشعور الخلقي 8 039 )0.92( e‏ 


2- الاختيار الاجباري (Geant‏ 
أ- الشعور بإثم الجنس 0.320.86 7 )0.95( 


F 4 a 1‏ 
و Rae‏ یی هوم اک کے 
1 بسي 





ب- العدائية 0900 040 039 )0.76( 
ج- الشعور الخلقي ۰ 052 4860031 055 0.26 )0.84( 


Sharri 
الجمل غير المكتملة‎ -3 
(0.48) 037 017 0.64 043 0.10 073 ۰ أ- الشعور بإثم الجنس‎ 


ب- العدائية 0.10 0.63 0.17 0.22 067 0.19 0.15 )0.41( 

ج- الشعور الخلقي 35.0 0.16 0.52 0.31 O56 O17‏ 0.41 030 )0.58( 
< 602 
عن د. ل. موشیر. قياس الإثم باستبانات التقریر الذاتي sel. J. of consulting & clinical‏ طباعتها 1968 من قبل رابطة 
السیکولوجیین. 


== 1 


























يس ممع عام موی a‏ نيجس سي 


يميه سس 














7 








تحليل gal all‏ الناتجة عن تطبيق نظرية إمكانية التعميم (عرضت في الفصل 8). ويفترض أن 
كل قياس يؤخذ على الفرد يمثل عينة عشوائية من نطاق القياسات الحتملة التي يمكن 
الحصول علیها. وهذا النطاق قد يتغير عبر أبعاد متعددة. تسمى عواملء والتي يتم تشكيلها 
بطرائق قياس مختلفة. ويعتمد تحديد الأبعاد المناسبة فى صدق البناء على النظرية الخاصة 
بالباحث للبناء والنطاق الذي سیتم التعمیم dale‏ دعنا نوضی ذلك من خلال تقییم بناء ما مثل 
مهارات الاستیعاب القرائي للمفحوصین, فمن المکن قياس هذا البتاء باستخدام صیغ فقرات 
tage‏ (اختیار من duets‏ صع = خطاء نهابة مفتوحاه الزاوجاه ... (Gil‏ وستشعر بان 
تام اک LG Vaal‏ السو gl Cad‏ كانت از ال فى gets‏ ن 
النظر عن صیغ الفقرات الستخدمة في القیاس. وإن رغینا بمعرفة مدی جودة تعمیماتنا عبر 
صیغ الفقرات ستصمم دراسة © (عرضت في الفصل 8( باستخدام صیغ فقرات مختلفة. 
افترض أننا صممنا هذه الدراسة وتم اختبار كل مفحوص بصيغ فقرات عددها N‏ (في هذه 
الحالة فود القول بان النيافات ثم مطابقتها او معایرتها على ميحد صديغة الفقرة): وإذا اردنا 
اا lea‏ قراس 6 تیه ا لصلية القدواف ال حنيدها والمكن 
انتخهنامها مستکقلا فى DD Lad js‏ وهنا ous‏ رسيم الففرات بعد وا وال إمكانية 
التعقيم النانيت شوت * ۱ 


Op 2 


2ر0 Op‏ + 02 
حيث أن Op?‏ ترمز لتباين الأفراد 
و Ope?‏ يزمز لتباين وتفاعل الأفراد والصيغة. 
و Oe?‏ ترمز إلى عناصر التباين غير المفسر للدرجات. 


ويشير كين )1982 (Kane,‏ إلى أن هذا المعامل هو معامل صدق مع ملاحظة أنه يمكن 
تفسيره على أنه متوسط معامل الصدق التجميعي الناتج عن الاختيار العشوائي لطرائق 
مختلفة تقيس السمة نفسها من نطاق الطرائق الممكنة. 
ڪا وقد يلاحظ القاری أن تركيب معامل إمكانية التعميم هذا تقديراً لمعامل الصدق ولا يختلف في 
gers il}‏ معامل إمكانية التعميم القدم في فصل )8( على أنه تقدير للثبات. فهل هذا يشير 
إلى أن نموذج كين لا يميز بين الصدق والثبات؟ هنالك ثلاث طرائق مختلفة.على الأقل للاجابة 


ki : 


دس دج 


peer AME میم مرو‎ ` 
zy ا‎ 





. f 
9 0 ‘ 1 
bed مر یم‎ 
مر‎ ae Paes fe i 


عن هذا السؤال. الأول حدد كين بالتخضیص (Oe? + Opp? + O?p/ (Op + ۳ p) = o2)‏ 
على أنه معامل لتقدير الثبات, لذلك فإنه قيد تقدير الثبات لمعاملات إمكانية التعميم التي تكوّن 
طراثق القیاس الختلفة aed‏ كانتا ولیس عشواثياً (ویعد هذا تقدیرا لا اطلق عليه لورد ونوفيك 
(Lord & Novick, 1968)‏ معامل ثبات خاص). الثاني: هو أن التمییز بين معامل إمكانية 
التعميم . على أنه تقدیر K Geral‏ الثبات هو‌مفاهيمي وسيعتمد على البناء ونطاق 0 
كمثال: يمكن طون الاحتبار آن ta‏ هی ا ار tales‏ وامتفد ا الطزيظة 
دراسة ثبات ولكن دراسة gb‏ ئق قياس مختلفة على أنها دراسة صدق. 
التداخل عبر الأساليب المتعلقة بدراسة الصدق: 

معن ay A SU‏ الفلا اش خی الوصدول اتن سدق اما 
فق ییدی hf‏ هه الطرائق:مقتصرة فى تطبيقاتهنا غل انوا Tinea‏ من الاختيارات: فللوضيوك 
إلى acl‏ ماك بير هرمن خلال رخات هار من الشات استخهام اخواام خر و سح 
رات الصدق. على سبيل SLU!‏ افترض أن باحث يعتقد أن النجاح في مساقات العلوم 
الجامعية تعتمد تعتمد علی قدرة الطلبة على قراءة المادة التقنية مع فهمها ویعخقد ایضا أن 
الاختبارات التقليدية للاستیعاب القرائي غير مناسبة لتقييم هذه القدرة, وقد طور هذا الباخث 
اختبار "قدرة قراءة الادة التقنیة" تتالف من نصوص مختارة من الکتب القررة في الفيزياء 
الا في مستوی AAS‏ واقیم کل نمی سطسلة اما من تزع الاشتیار من مخهدد عن 
العلونات اتن فى امین كد ها فرراسة یی السكوق متاشية لتحديه ترا SSNs‏ 
اک المادة الرهونة فى اا الماك هن يدض قتا هة امرس لاک افو 
في مساقات العلوم. ويمكن إجراء دراسة صدق مرتبط بمحك للتعرف على ما إذا كان الاداء 
على الاختبار مرتبط بالدرجات التي يحصل عليها الدارسون الجدد في مساقات العلوم. لذا 
فعند هذه النقطة يمكن استنتاج أن الدرجات العالية في الاختبار تعني قدرة قرائية تقنية عالية 
الاي onan Ne‏ ار قاد لاه (cere, Gere!‏ اتسين وة اد 
الاختبار تقيس معلومات علمية عامة يمكن أن يكون الطلبة قد اكتسبوها في العلوم التي 
tas‏ قی Siang Gas ta)‏ الناامية تكو اكيز قتر خعالبه علی اسان عن 
الاسئلة بشکل صحي ودون قراءة النصوص على الاطلاق, وذلك عائداً إلى آعدادهم الجید في 
الدرسة, وقد یحصل هؤلاء على درجات عالية في مساقات الكلية في العلوم. لذا فان الصدق 
كون کف اکتا و ممما پاش اكان SUA‏ مقس شا ما واختها من الغعرفة 
العلمية العامة ومن خلال الاستيعاب القرائي العام آو الاستعداد الاكاديمي, ومثل هذا الجهد 
في الصدق يجب أن يتضمن كل من صدق الحتوی والصدق المرتبط بمحك وصدق البناء. 
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إن إدراك الحاجة إلى أنواع عدة من الصدق وحقيقة أن البناءات يُستشهد بها في وصف 
نطاقات الاداء أو تعريف المحك قادت بعض المؤلقين مثل ميسك )1981 sat (Messick,‏ موقفاً 
Gee Ou‏ البناء قد لا يكون کل الصدق ولكنه بالتأكيد قلب . الصدق. والمناظرة حول أي نوع 
من ارات هو الأكثر أهمية وأساسية نوقشت في أدبيات aail‏ اوه تضيف قرخ قا 
(انظر كم تسال: (Guion, 1977, 1978, 1980, Loevinger, 1947, and Tenopt,‏ 
(1977والوقف الذي نتبناه هنا هو أن نوع توت o‏ أهمية يعتمد مد على النتائج المراد 
استخلاصها S| e‏ ل RANE‏ 


والمناقشة حول أي نوع من مؤشرات الصدق هو الأكثر أساسية لتفسير درجات الاختبار 
قد يخدم بالفعل لحل الغموض في هذه النقطة. فيجب على مطوري الاختبارات ومستخدميها 
أن يفكروا من خلال نوع الأدلة الأكثر مستخدمية لدعم الاستنتاجات المراد استخلاصها من 
telah Ras ee ails‏ وا ينعن تة رامات التق التي ترك ن مكل منم 
الأدلة. والأكثر تفضيلا تضمين هذه الدراسات أنواع الصدق الثلاثة التي نوقشت في هذا 
الفصل. 
معاملات الصدق للدرجات الحقيقية: 


تفترض نظرية القياس التقليدية أن الأخطاء العشوائية للقياس غير مرتبطة. فإن كان هذا 


الافتراض صحیحاً فان معامل الصدق دين ا الملاحظة علي الاختبار وقياس Peal‏ 
به یکون اقل مما يجب إذا كان هنالك ار عاط من lagi‏ اللحعيقية هلي قاس ية 


البرهان البسيط العلاقة بين معامل صدق الدرجات اللاحظة ومعامل صدق الذرجات الحقيقية 
المناظر له على المقياس نفسه. تذكر أنه في فصل 6 وضحنا بأنه يمكن التعبير عن الارتباط بين 
درجات الاختبار في موقفين اختباريين على أنه نسبة التباين المشترك للدرجات الحقيقية إلى 
حاصل ضرب انحرافاتها المعيارية بالاستدلال نفسه (أخطاء القياس غير مرتبطة). ويمكننا 
الآن التعبير عن الارتباط بين درجات الاختبار (0)ومتفیر آخر لاب: 


t, Ê 
(3-10).......... ke _ p 
Oy Ox N 


xy 











3 
4 Pee gue هذا‎ boaii 
Oy ` Lyx 
فإن القيمة لا تتغير وتصبح:‎ 
ly) u yt 


OS = م‎ 
ty x yN 5 


| 


ويمكن إعادة كتاية معادلة )4-10( ae‏ ضبرب aklai SBN‏ 


0 ) ( =) Cs S Sipe 
ومن خلال تعريفات كل من معامل 0 ومعامل الثبات نصل إلى:‎ 


(5-10).......... سس‎ Pxxĵ 7 Pryty = Pyy 


ولان قيم كل من Pri‏ و MET Pyy‏ فان معامل أرتياط الدرجات الملاحظة 

Dey‏ سیکون أقل من معامل الارتباط نين ارجا الحقيقية بحل المعادلة )15-10( للحد 

ty ۰‏ على النحو الاتي: 
جم 


۱ ۲ ۸ 7 


ويطلق على المعادلة (10- 6( Ghat‏ التصحيح من أثر التلويث (attenuation)‏ لانها تؤدي 
إلى معامل صدق مصحح من أخطاء القياس على متغیری المتنبئ والمحك. وقد يكون أحياناً 
ن قوس افالتخا ابه Cal al east) etal‏ الجن RS,‏ موك له 
" يتضمن درجة أكبر من الصدق الذي يمكن الحصول عليه بوساطة الاختبار المتوفر ومقياس 
المحك. ومع ذلك فهنالك موقف يكون معامل الصدق مضللاً ويجب تعديله. افترض أن باحث 
في دراسة صدق اهتم بمعرفة أي من المتغيرين المختلفين AST‏ ارتباطاً في البناء الذي نهتم به. 
فإن كان قياس المحكين بثبات متساو غير ممكن فإن التضليل في معاملات الصدق قد يكون 
آکثر ملائمة لقارنة معاملات الحتدق الملاحظةء وعلى سبيل المثال فإن تقديرات الصدق 
اللاحظ لعينة يساوي Pyy‏ > 0.40 + و .يم = 0.30 








(6-10).......... 
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۱ A A A 
ویتطبیق معادلة‎ 0.25 = Pza و‎ 0.81 = Pyy و‎ 0.64 = Pi ولكن تقديرات الثبات‎ 


)6-10( علی هذه السالة نحصل علی: 
0.40 


oem 0 
081, 064, ** 


J 


0.56 = 


0.30 


م- سسس سے 
` ,064 025 


0.75 = 











٠٠‏ وغیاب الثبات للستنبی آو الحك. وتدون نتائج الصدق المرتبط بنحك في. 


أن مات ت الق التي ت تهت 


رجا نج 


ERR o PARRE] ot tr‏ 0 ¢ توق 
الواجب آخذها بعين الاعتبان عند استخدام معاملات الصدق.. 





التمارین: 

1 افترض أن مدرسة في مقاطعة كبيرة خططت لتأسیس برنامج اختبار آدنی كفاءة 
موه easel E AEA‏ زاس للقي ماك هه اقا ریم ورین 
على الستوی التجاري لتقریر آیهما أكثر ملائمة لتقییم الآداء على الهارات والکفاءات 
في هذه BU‏ مان ال goa‏ المدراء وامغلفين يفزاوجة cigs‏ کل 
الاختبارين مع قائمة الهارات الطوبة. ووجد آن 4650 من فقرات كل اختبار طابقت 
مهارة أو أكثر. ما البيانات الإضافية التي قد تكون مهمة في تقرير أي الاختبارين 
يرجح على الآخر. 
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2 افترخن عينة البیانات التضمنة BIS Gl put‏ محکمین Gill‏ 52855 مدی Taille‏ کل من 
الفقرات الخمس مع اهداف كلانه فة فهل تقدیرات الفقرة الخامسة تشر درجة 
أعلى من المطايقة. 





أ- ما معامل توافق الفقرة - الهدف لكل فقرة مع کل هدف؟ 

ب- أي الفقرات يبدى أنها تقيس الهدف الأولء الهدف الثاني الهدف الثالث؟ 

ج- يبدو أن الفقرة الثالثة تطابق هدفين بشكل جيدء مع أنه ليس لها معامل توافق le‏ مع 

3/ افترض أن صضيغني اختیار (HG)‏ طوزت لنطاق 96 لحتوى تنه وخ ظیقت كلا | لصیختین ۱ 
على الجتمم نفسه. باستخدامك الدرجات الحقيقية والدرجات الخطأ وافتراضات 
نظرية الدرجة الحقيقية التقليدي, اثبت أن XN = 024g + Oey‏ - پک ۶ إذا 
كانت الصیغتان متوازيتين. 

4 افترض أن مطور اختبار كُلف بإعداد صيغ عديدة لاختبار كفاءة متخصص لإجازة 
على درجات متوسط مربعات الفروق لا تقل عن 0.80 فهل تكون هذه التجرية أكثر 
نجاحاً إذا كتب كل فريق من معدي الفقرات مجموعة فقرات متجانسة جداً أم إذا كتب 
هؤلاء مجموعة فقرات غير متجانسة؟ لمان!؟ 

5 باتباع مواصفات دراسات صدق عدة. اقرا كل وصف مما يأتي» وحدد أي المشكلات 
يمكن أن تؤثر في النتائج: 

أ- أعد alas‏ رياضيات في المرحلة الثانوية اختبار لتحديد الطلبة البدعین» وطبق 
الاختبار على )100( طالب فى الدرسة: وعلی امنا درجات الاختبار العالية 











يسمح للطلبة الانخراط في مساقات الرياضيات في كلية جامعية محلية. وفي نهاية 
مساق حسب مطوّر الاختبار الارتباط بين درجات الاختبار مع درجاتهم في مساق 
الكلية. وقد وجد المعلم أن الارتباط له دلالة إحصائية. 

ب- alle bb‏ نفس صناعي اختبار لتعيين متقدمين إلى وظائف مهنية في شركة معينة 
وطلب من المشرفين على المهن تحديد مواقع العاملين الحاليين على تدريج مؤلف من 
فتات: آعلی من الوسط ووسط ودون الوس وپعدها اختبر العاملین الذين کانوا من 

. فئة آعلی من الوسط diay‏ أدنى من الوسط وقارن بين متوسطاتهم. ووجد alle‏ 
. النفس أن الفرق ذا الدلالة الإحصائية يحابي مجموعة آعلی من الوسط. 

ج- اقترح alle‏ نفس اجتماعي اختبار في النضح الاجتماعي للأطفال. وطبق لاختبار 
على )50( طقل في مرحلة ما قبل الدرستة. وعلق الوالدان والعلمون على درجات 
هؤلاء الأطفال. وقد طلب من العلمین ملاحظة الأطفال بالاهتمام للأشهر الثلاثة 
القادمة والاحتفاظ بسجلات لسلوكات کل طفل التي قد تفيد في تقییم مستوی 
النضج الاجتماعيء ورتب عالم النفس الأطفال بالاعتماد على مستوى النضج 
الاجتماعي, ورتبهم أيضا بالاعتماد على درجات الاختبار. وحسب معامل ارتباط 
الرتب لسبيرمان وكان عالیا. 

د- تم إجراء صدق لاختبار ذكاء جمعي وذلك من خلال ارتباطه باختبار ستانفورد = 
بينيه. ویعدها طور alle‏ نفس تربوي صيغة مختصرة للاختبار الجمعي الذي 
يتضمن فقرات لفظية dads‏ وحسب الارتباط بين درجات الصيغة الطولة والصيفة 
الختصرة. وجد أنه dle‏ وموجب. واقترح بعدها استخدام الصيغة المختصرة 
للاختبار الجمعي ليحل محل اختبار ستانفورد - بينيه والذي يتطلب Las‏ أطول 
لیطبق على كل مفحوص. 

6 مع الأخذ بعين الاعتبار نوع الاستنتاج الذي يرغب به مطور الاختبار من درجات 
الاختبار, ولکل من الواقف الآتيةء بين أي نوع من دراسات الصدق آکثر ملائمة (صدق 
المحتوى آم الصدق الرتبط بمحك تنبؤيء أم الصدق الرتبط بمحك تلازمي al‏ صدق 
البناء)؟ 

أ- عالم نفس اجتماعي طور قائمة بهدف التعريف بالعاملين بالوظائف المرتبطة 
بالصحة. واستخدمت العديد من السلوكات لتحديد "الاحتراق النفسی" المتضمن 
الغياب العالي. الفشل في التوافق مع الأمن المؤسسيء والعلاقات المشدودة مع 
الاو اف 
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ب- طور alle‏ نفس تطوري مختص بالراهقة استبانة لتطبق على طلبة المدرسة 
المتوسطة للتنبق بمن سيفشل في الدرسة الثانوية. 

ج- تم تطوير تدريج لتقدير الأداء الصفي للمعلمين في السنة الأولى في التعلیم. وطلب 
من العلمین الخبراء فحص الفقرات على التدريج المقدّر لرؤية ما إذا كانت تلائم 
الأداء الفخال. 

د- طور اختبار استعداد أكاديمي غير لفظي للأطفال ذوي إعاقات السمع في مرحلة ما 
قبل المدرسة. واستخدم الاختبار كمقياس للانتقاء لتحديد الأطفال الذين لديهم 
صعويات تعليمية في القراءة بالفصول العادية. 

7 فيما يأتي مصفوفة السمات - الطرائق المتعددة أعدت من بيانات دراسة ماركس وواين 
(Marx & Winne, 1978)‏ آفحص مصفوفة الارتباطات هذه واجب عن الأسئلة التي 
تليهاء ودرّن مولفي هذه الدراسة الارتباط المصحح من اثر التلوث (وقد he‏ / مؤلفو 
الدراسة الاختبارات الفرعية على أنها السمات وأدوات مفهوم الذات الختلفة على أنها 
الطرائق المستخدمة في قياس هذه السمات). 





—i‏ قائمة جوردن لمفهوم الذات 
1. المظهر الفيزيائي ‏ 0.70 
2. الاجتماعي 0.64 0.64 
3- الملائمة الشخصية ‏ 0.97 0.75 0.73 
4 اللائمة الأكاديمية ‏ 0.60 088 092 0.66 


ب- قائمة بيرز - هاريس 
1- المظهر الفيزيائي 0.78 0.66 0.63 0.50 0.80 
2~ الشعبية 0.59 0.59 0.62 0.42 0.87 0.79 
3- القلق 0.53 0.57 0.55 0.52 0.72 0.70 0.73 
4 الدراسات الاجتماعية 0.59 0.81 0.68 0.80 0.90 0.86 0.75 0.80 





W. Marx and P.H, winne Construct Interpretation of three Self - concept in- 
ventories. American Educational Research J ournal, 15 , 99-109, Table 2 .Cop- 
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yright1978 , American Educational Research Assn, Washington, D.G. 
لكل آداة.‎ das Yt آ- ما تقدیرات الثيات للاختیارات الفرعية‎ 
أي من معاملات السمات المختلفة - الطريقة الواحدة تطرح تساؤلات حول صدق‎ =a 
البناء لسمة المظهر الفيزيائي.‎ 
ه- أي من معاملات السمات المختلفة - الطرق المختلفة تطرح تساؤلات حول صدق‎ 
افترض أن الباحث اختار أن يدون معاملات الصدق غير الملوثة لييانات المصفوفة‎ /8 
المبينة فى السؤال السابع. ما القيم الممكنة لمعاملات الصدق التجميعي.‎ 
باستخدام المعادلة (6-10) في حساب معامل الصدق غير الملوث. بين اشتقاق‎ /9 
مختصر للعلاقة:‎ 


Oxy = / مر‎ ۷ P yy’ 

ay 0‏ طالب دراسسات علیا فی علم A‏ التهیلی فى دلیل اختبار خان 
محال شاك دقاف الأكتار OES‏ ناکم معامل السدق ادا UN‏ واختبار 
ES‏ شمه مقتانية = 0.78 وقرق أن هنال the‏ اكه سم MNT‏ اک 
صدقاً من ثباته". فهل هذا صحیح بالضرورة؟ لماذا نعم ولماذا SY‏ 

1 افترض أنه تم تطویر اختبار جدید في الاستعداد لطلبة الدراسات العلیا. ویرید مطور 
sta‏ ان بكو جما ارقا ما اا ان مقوشط هات الفضل اراي 
الأول ا فى EN ER PIE A E‏ ا 
على كدي E TSE E T‏ اك a EEEE‏ لحان RO‏ 
الأدنى ل (K)‏ للمعامل الذي يجب أن يزداد بنسبته طول الاختبار للحصول على معامل 
الصدق الطلوب. وهل أن زيادة طول الاختبار بنسبة المعامل (K)‏ يؤكد تحقيق معامل 
الصدق المرغوب؟ فسر أهمية مثل هذه الصيغة؟ 


= 1 





























m بيصي صعب سس بيه‎ apa sep, 


8 ل سمي سي بر 
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الفصل الحادي مشر 
الطرائق الاحصائية للتنيؤ والتصتیف 


اش اف سای شنت متا RELA‏ 
العلاقة بين درجات الاختبار والحك. وفي معظم الشکلات التي تستخدم التنبق بالاداء الفردي 
في الرافف E EEE E AE‏ عو مق ااك P‏ 
ا شاه ieee‏ فش حتف lh‏ اسان eal‏ تفای Gta‏ سعدا 
S‏ اک موف TA‏ اما او مان ayaa ce‏ وم je‏ ره سکف 
وقي هذا السیاق سنصف طرائق الارتباط الجزئي والانحدار التعدد. وهدف ثاني هو وصف 


على تصنیف متقطع (من فئتين أو أكثر). ویعد تحلیل دوال التمییز تقنية مستخدمة في مثل 
هذه الواقف. وقد طرحت الطرائق الاحصائية هنا بدرجة كافية من التعقید وذلك لتسويغ 
الحصول على کتاب معالجته شاملة للموضوع. ۱ 
والعرض في هذا الفصل مقيدٌ پتفسیر مختصر للطريقة» وتم عرض مثال لدراسة الصدق 
التي تستخدم الطريقة وعرض النتائج مثالياً مع التحلیل والتفسیر الرافق لها. والقصد من 
هذا العرض تزوید طلبة نظرية القیاس بالعرفة الأساسية الضرورية لتمییز متی وکیف تطبق 


هذه الطرائق فى جهودهم الخاصة لتصدیق الاختبارات ولفهم تقاریر دراسات الصدق 


الوجودة في آدبیات القیاس التي تستخدم هذه الطرائق» ویمکن حذف الادة الطروحة في هذا 
الفصل دون فقدان الاستمرارية مع الوضوعات التالية الغطاة في هذا الكتاب. 
الارتباط الجزتي: 

هنالك مواقف في صدق الاختبار یتوافر لدی مستخدم الاختبار واحد أو أكثر من المتنبآت 
الفيدة, ولکن نطرح الکن السؤال: ما قوة العلاقة بين الحك ومتتبی اضافی لجموعة فرعية من 
الفحوصین التجانسین بالنسبة للمتتبیم الحدد مسبقا؟ علی سبیل JEL‏ اقترض ا 
القبول الدرسي في القانون والتي یقبل بوساطته الطلبة على أساس متوسط درجاته في 


(1) دون بور في )1982 (Powers,‏ معاملات الصدق LSAT‏ واختبار القبول في كلية الحقوق, في هذه السالة. 








الدراسة الأولية التي تستخدم كمتنبئ لمتوسط الدرجات في السنة الأولى لدراسة القانون. 
افترض آن الازتباط بين هذا المتنيئ والمحك جم = 046 ۰ ومتنبی آخر ممكن هو درجة 
المقبولين في اختبار القبول لدرسة القانون (LSAT)‏ والذي ارتباطه مع متوسط درجات السنة 
الثولی في دراسة القانون مرم = 0.48 وقد یکون الشرف على القبول مهتماً في معرفة قوة 
العلاقة بين LSAT‏ ومتوسط GPA‏ في مدرسة القانون وذلك للطلبة التشابهین في GPA‏ في 
الدراسة الأولية (أي التجانسین بالنسبة ‏ :1× ومعامل الارتباط الذي يفيد في هذا الوقف هو 
معامل الارتباط الجزئي الذي پرمز له رورو ویشیر الرمز السفلي إلى اننا مهتمون 
بالعلاقة بين لا و Xo‏ لجموعة متجانسة من التلامیذ بالنسبة ل Ky.‏ وصيغة حساب معامل 
الارتباط الجزئي هذا: 


۸ ۸ ۸ 
Px1x2 Pyx l- Pyx2 


توس يت me‏ 
,\ 1- میم 7 1- 024349 
وكما يتبين من هذه الصيغة فان قيمة الارتباط الجزئى ي لا يعتمد على الارتباط بين Ka oY‏ 

فقط بل وعلی ارتباط ى 361 والارتباط بين التنبئین × و Xp‏ فعلى سبيل المثال في مسالة 

مدرسة القانون إذا كان a‏ بين GPA‏ الأولية ودرجات dua LSAT‏ 0.33 = ورز,0» فان 


0.39= _(0.33) (0.46) -0.48 _ .33( (0.46) -0.48 ۰ ۰ 6 


م 
را )2046 رأ )0.33 )20.46 ,\- )2(0,33 
ومن‌جهاة اخری ان کان LUM‏ بين المتنبئ الأول والثاني أكبر (وليكن 0.60 = وری0) 
فان الارتباط الجزئي بين لا و م26 مع ضبط Ky‏ یکون: 
a‏ 048-)0.46( )0.60( 


ae e ما مرس زب‎ = Pyxoxy 
20.60-\, 20.46 -1 \, 


ومعامل الارتباط هذا آقل من معامل الارتباط الأول وذلك لأن الارتباط بين المتنبئين في هذه 
الحالة عالي وموجب. ع ی ادرتیاط الجرني Sa‏ أن پتجاور الترایط 
الاصلي إذا كان الارتباط بين رگا و =P, xa Xa‏ -0.25, فان قيمة ر .یړ یکون: 


0.29= 


سس 5 = 









































4 046-048 025( 
‘et 2yx1‏ سس سس 
۳ ,\ 2046-1 رل 2025 


وفي هذه الحالات جمیعها فان القيمة الوجبة لعامل الارتباط الجزئي بين LSAT‏ متوسط 
في مدرسة 5 القانون (Sas GPA‏ تفسیره بشکل عام ليعني أنه وللمفحوصین التشابهین في 
المتوسط بالدراسة الأرليةء يجب أن تُعطى الأولوية للذين حصلوا على درجات اعلى على 
LSAT‏ علاوة على ذلك يوضع المثالين الأول والثاني أنه عندما يكون ارتباط كلا المتنبئين 
إيجابي مع المحك فإن مستخدميه أو فائدة المتنبئ الثاني تنخفض كلما اقترب ارتباط المتنبئين 


0.6+ = 


من 1. 

ويمكن توسيع الارتباطات الجزئية لتجزئة أي عدد من المتغيرات» وبالطبع عند توافر عدد 
كافي من المفحوصين. (واثبت تجريبياً أن حجم عينات درأسات الارتباط هو العدد الأكبر من 
الآتية: 100 فرد أو 10 إضعاف عدد متغيرات الدراسة). ومع أن حساب معامل الارتباط 
الجزئي Sas‏ يدوياًء إلا أن وصف العملية الحسابية معقد وحذفت الصيغ الحسابية هناء 
ویمکن ایجادها في بیسدهازر )1982 (Pedhazur,‏ وعادة تجری هذه الحهشایات بوساطة 
الحاسوپ. ۱ 

ومن all‏ ملاحظة أنه كلما تم تثبیت متغیرات إضافية فان الارتباط قد يتغير في الاشارة 
أو القيمةء ومن المهم أيضاً تمييز أثر خطأ القياس في الترابط الجزئي» والقيمة المطلقة للارتباط 
من الدرجة صفر (الارتباط دون أي تجزئة) بين المتغيرات المشوشة بخطأ القياس أقل من 
القيمة المطلقة للارتباط الذي نحصل عليه للبيانات الثابتة تماماً. والارتباط الجزئي لمتغيرات 
مشوشة بخطأ القياس قد يكون أكبر أى أصغر من آو مختلف في الإشارة عن الارتباط الذي 
تم الحصول عليه لبيانات ثابتة تماماًء وصيغة تصحيح الارتباط الجزئي لحك وفئتين اثنتين 
الناتج عن التشويش يكتب على النحى الآني: . 


۸ A A 
Pyx1 . Pxix2 - Pyx2-Pli 
kaniri | 0 Ta 
P*xly2~ 0118 عترم‎ P11. Pyy V 


حيث ترمن ديم 02 yy‏ م إلى تقديرات الثيات. افترض أن تقديرات الثيات لمتوسط طلية ۱ 
الدزاسة Lill‏ ودرجات LSAT‏ وستوسط مدرسة القانون هي 0.64 067,0.87 على 
التواليء والارتباط الجزئي الحقيقي القدر بين LSAT‏ ومتوسط السنة الأولى GPA‏ في 
مدرسة القانون (وذلك بعد التجزئة ل GPA‏ في الدراسة الأولية): 


= Pyx2x1 




















(0.33) (0.46) -(0.48) (0.64) ae 


re eee a 
0.33 -(0.87) (0.64) \ 70.46 -(0.67) (0.64) | ۳ 


ومن الهم تذکر أن الارتباط الجزئي الحقيقي الحسوب قد یکون مفيداً لأهداف نظرية (في 
ومحك ثباتها لیس تاماً (اي آقل من الثبات التام). ویهتم الثال السابق باستخدام الارتباط 
الجزئی فى سياق صدق التبنؤات. وعندما تکون الارتباطات الجرئية بین0۳۸۵ فى السنة 
الأولى ودرجات LSAT‏ دالة إحصائياً یمکننا القول أن LSAT‏ له صدق تنبژي عند إضافته 
إلى متوسط GPA‏ فى الدراستة الأولية کمتنبی لتوسط السنة الأولى فى مدرسة القانون. 
ویمکن استخدام الارتباط الجزئي في سياق صدق البناء» على سبیل الثال افترض لفهوم 
موضوعات أكاديمية معينةء وتتوافر اختبارات لقیاس کل منهماء فالنظرية تقترح أن التحصیل 
في موضوع آكاديمية معين يرتبط إيجابياً مع كل من مفهوم الذات الأكاديمي العام ومفهوم 
الذات بالمجال الأكاديمي الخاص. إضافة على ذلك فإن النظرية تقترح أن مفهوم الذات 
الخاص بمجال أكاديمي معين يجب أن يرتبط إيجابياً بالتحصيل في المجال نفسه حتى 
للمجموعات المتجانسة في مفهوم الذات الأكاديمي العام. ويجب أن يتذكر القارئ بأن التحقق 
من صدق البناء يستخدم تحديد ما إذا كانت درجات الاختبار تتطابق مع التنبؤات النظرية. 
ونا ححياث التطايق انه مسد مورا إنحانياً لصددق ينا الاكتارات امشتحخدمة. 


وقد جمع شافيلسون وبولس )1982 (Shavelson & Bolus,‏ بيانات اختبار تحصيلي في العلوم 
متغيرات أخرى. وكانت الترابطات بين أزواج المتغيرات الثلاث على النحو الآتي: 


0.73 ب‎ Pxix2 « 0.41 . Pyx2 ‘ 0.49 = Phyxt 


مفهوم الذات الآكاديمي) كما يأتى: 


0.51 = 


A A 


Pyx2 . Pxix2 - Pyx1 


Pxix2 7h 7 ثم‎ - 1 ۳ 


= (2 


== 7 
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(0.73) (0.41) - 0.49 


از ۱2۵4۸ 1- )20.73 


ویدعم هذا الترابط الادعاء بأن صدق البناء لمقياس مفهوم الذات في العلوم یتفق مع 


0.31 = 


تعديلها لإزالة أثر الخطأ من أثر التشويش (التوهين). 
الاتحدار المتعدد: 

عرض الفصل الثانى الانحدار المتعدد كمنهجية تفيد فى تطوير معادلة تنبق عند توافر 
درجات متنبئ ودرجات محك de sank daly‏ المفحوصين نفسها. وعند توافر اثدين آو أكثر من 
المتنبآت يكون الانحدار المتعدد مفيداً فى تطوير معادلة واحدة للتنبق بالأداء المحكي من 
مجموعة التنبات» تذکر الصيغة العامة لمعادلة التنبق لتینی واحد: ۱ 


BAD ` Xby.x +0 الاح‎ 


وترمز X‏ إلى Lays‏ الفحوص على للتنبی» و ۳ إلى درجة الفحوص التنباً بها على 
الحك. ق by x‏ ا E AE‏ أنه حالما تستخدم درچات عينة لحساپ C‏ و 
by x‏ فإنه (Sa‏ استخدام معادلة الانحدار الحصول على قيمة متنبأ بها ل Y‏ (آي مفحوص) 
عند توافر درجته على K‏ مع العلم Gl‏ الفحوص والعينة المستخدمة في حساب معادلة 
الانحدار اختيرتا من المجتمع نفسه؛ وإن كانت القيمة المطلقة للارتباط بين »و ل عالية لدرجة 
كافية فان القيم التنباً بها ل y‏ تكون دقيقة وغير متحيزة (وبالرجوع إلى معادلة 2 -21, 
والمثال الحسابي الذي يليها يفيد في مراجعة هذه المفاهيم). 


مثال بمتنبئين اثنين: 
ب أن ae‏ مواقف يتوافر فيها لمستخدم ا sla‏ متنيئين 


asi ae, 0‏ أنه العامل الرحيد في اتهاذ القرار يعد عملا کیک ر تش). للتوضيح 


خن الموقف الذي يهدف إلى تحديد مجموعة متنبأت تفيد في تحديد الأطفال المتخلفين في 
all‏ اعرف وی مداه فصن رخو ans‏ اعيقاك الق خن مواق متو افر 
عند الولادة: وفی هذا الوقف هثالك متنبنین ممکنین هما الوزن عند الولادة والدرجة على 
تدریج لعوامل الخاض والولادة تحدد من خلال تاريخ الحالة آثناء الحمل والولادة. وقبل 





الاستخدام الفعلي لهذه المتنبآت فمن الضروري تطوير معادلة تنبؤية لجمع درجات الوزن عند 
الولادة وعوامل المخاض والولادة. ومن الضروري أيضاً تحديد مدى دقة المتغيرين في التنبق 
+X Dyx1 x2 tesy‏ درک 5 وم (4-10) 


وفي مشالنا تكن "ل هي القيمة التنباً بها على مقياس ستانفورد - بينيه» وترمز × إلى 
الوزن عند الولادةء و ر× الدرجة على متغير عسوامل المخاض والولادة والحدیننی, ,ربط 
byx2x13‏ يسميان معاملات الانحدار و C‏ هي القاطع؛ والقيم العددية لمعاملات الانحدار 
والقاطع نحصل عليها بحل العادلات باستخدام المتوسطات والانحرافات المعيارية للمتغيرات 
والارتباطات عبر أزواج المتغيرات. ويبين جدول )1-11( هذه الإحصائيات لمثال التطور 
العرفي والصيغ لمعاملات الانحدار والقيم العددية لهذا المثال على النحو الاتي: 


۸ ۸ 4 
) Px1x2 Pyx2 - Pyx1) oy 
(5-11)... زر( سسس‎ xr 


(0x1x2 - 1) êxı 
(0.111-) (0.149) -(0.301) 19.251 
]2)0.111 -) -1 ] 887.641 


A A A 
( Pyx1 Py1x2 - Pyx2) û 
)611( ما ا‎ 


(P22 -1( مت‎ 


)0.111-( (0.301) -(0.149) 19.251 
0.247 E بسع صصص‎ E 
]2)0.111 -) -1 19.121 


)2( الشكر لجون هولسترم (June Holstrum)‏ لسماحه لنا استخدام بيانات JU‏ مع ملاحظة أن هذه ألبياتات جمعت كجزء 
من دراسة هدفها AST‏ شمولا مما ذکرنا. ۱ 
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الولادة» وعوامل الحخاض والولادة. 





وزن الولادة مقاس بالغرامات. 
والصيغة والقيمة العددية للقاطع هي: 
Byx2 xt Wx2-byx1x2 Wy =C‏ 07-11 
95.326 - )0.006( )2724.9-( - )-0.247( )6.445( 
= 80.568 

ويالتعويض لقيم القاطع ومعاملات الانحدار المحسوية بمعادلة التنبؤ العامة (معادلة 11- 
4) نحصل على معادلة تنب خاصة بهذه الدراسة: 

Xo 0.247 -X1 ۰006 + 80.568 =y 

لطفل وزنه عند الولادة 2000 غم ولعامل المخاض والولادة ۰20 فإن درجة 10 المتنباً بها 
على مقياس ستانفورد - بينيه تكون: 

(20) .247 - (2000) 0.006 + 80.568 =y 

۱ 87.6 = 

LS,‏ في الانحدار الخطيء فإن قیم القاطع C‏ ومعاملات الانحدار (D'S)‏ التي حصلنا علیها 
بهذه الطريقة ستقلل من الفجوة بين درجات ‏ الفعلية على الحك والدرجات التنباً بها CY)‏ 

تذکر أنه في الانحدار البسیط يرتبط معاملي الانحدار والارتباط بعلاقة بسيطة على النحو 
الأتى: 














SLD نا‎ SE =b 
( ) yx Ox yx 


ويطريقة ممائلة» فان معاملات الانهدار HLS Vy‏ الجزئي تريط بينهما علاقة 
والعلاقة بين Dyx2.x1‏ و 1× ور على النحو الاتي: 


A 
Oy.x1 


P 
(Á 9-11).......... JX Öxi = Dyx2x1 





وهنا يرمز Oy x1‏ إلى الخطاً العياري SA‏ ب Y‏ منك و يرم إلى الخطأ المعياري 
Sail‏ 7× من . ومع أن هنالك علاقة بسيطة بين الارتباط الجزئي ومعامل الانحدارء إلا 
أنهم يعبرون عن خصائص مختلفة للبيانات. فمعامل الارتباط الجزئي x2‏ 0 يعبر عن قوة 
العلاقة الخطية ين اويا ی e‏ نسي علي Xi‏ بینما يعبر معامل 
الانحدار Byz xg‏ عن كمية التغير عندما تتغير 2× نقطة واحدة ويقاء × ثابتة. لذلك فهي 
تعبر عن حساسية ۷ للتغير. آما العلاقة بين 2» 1را و Pya‏ فهي على النحو الآتي: 


۸ 





x2‏ روط = Pyxixa‏ ..........)9-11 ب( 


ی 

وتستخدم 3 للعلاقات في العادلات (19-11 ) و (11- 9 ب) عندما یکون 
هنالك آکثر من متنبئین. ویتم حساب معاملات الانحدار من درجات 10 الخام والوزن عند 
الولادة وعوامل الخاض والولادة. ومع أن الدرجات الخام شائعة الاستخدام في تحلیل 
الانحدار. الا أن الباحثین یستخدمون الدرجات الزائية (درجات (Z‏ بدلاً من الدرجات الخام. 
وعند استخدام الدرجات الزائية لتحل محل الدرجات الخام فان معادلة الانحدار تکتب على 
gal‏ الاتي: 

002 0 Byx2x1 Zx2 + Byx1 x2 Zx1 = ZY 

وهنا ترمز B'S‏ إلى معاملات انحدار محسوية باستخدام الدرجات المعيارية. لاحظ أن 
معادلة )10-11( لا تتضمن رمز للقاطع. وذلك GY‏ القاطع يساوي صفراً دائماً عند 
استخدام الدرجات الزائية في تحليل الانحدار. ويربط معاملات الاتحدار المعيارية 
والعاملات غير العيارية علاقة بسيطةء وعلى النحو الآتي: 


A 8 
(HAD) becca, byi ZL = Byat xj 
Oy 
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ويبين هذا ات لتعییر أن ضرب المعامل غير المعياري لتنيئ ما ب بنسية الانحراف المعياري 





الولادة: 
ô‏ 1 
Dyxixa xt = Byxı -X2‏ 
yl‏ 
خی 0006x‏ 
19.251 
= 0.276 


وتطبق العلاقة في المعادلة 11-11 عندما يكون هنالك AST‏ من متنبئین اثنين. 

وسيدهش القارئ فيما لى كانت المعاملات المعيارية لها مزايا على المعاملات غير المعيارية. 
والميزة التي يدعيها البعض هي أن القيم العددية لمعاملات معيارية اثنين يمكن مقارنتها 
مباشرة في حين قيم العاملات غير العيارية لا يمكن مقارنتها مباشرة. لذا فإن المعاملات 
المعيارية يمكن استخدامها لاختيار المتنبئ الأكثر فائدة. لماذا حدث هذا الادعاء ؟ سبب هذا هو 
لقارنة وحدات القیاس, فمعامل الانحدار ل ز× هي الكمية التي تتغير بها القيمة التنباة ل Y‏ 
Losic‏ تتغير Xy‏ وحدة واحدة مع بقاء X'S‏ الأخرى ALG‏ وهذا GY‏ معامل الانحدار غير 
المعياري للوزن عند الولادة = 0.006, فلطفلين الفرق بين وزنيهما pèl‏ ولهما درجات عوامل 
الخاض والولادة تفسها سيختلفان عن بعضهما البعض ب 0.006 نقطة على درجات10 
التنباً بهاء ويسبب هذا التفسير لمعاملات الانحدار فإن أي مقارنة عددية لمعاملين تتطلب تطبيق 
وحدات قياس المتنبآت في مقارنة المعامل غير المعياري للوزن عند الولادة (0.006) مع المعامل 
غير المعياري لعوامل الخاض والولادة )0.247( ويجب أن نفترض هنا أن وحدة قياس واحدة 
على تدريح وزن الولادة مكافئاً لوحدة واحدة على تدريج عوامل الضاض والولادة. ومن 
الواضع أنه لا يمكن الدفاع عن هذا الافتراضء وللتخلص من هذه المشكلة يحسب بعض 
الباحثين معاملات الانحدار المعيارية ويقارن فيما بينها. والافتراض هنا أن درجات Z‏ لها 
وحدة القياس نفسها للمتغيرات جميعها. على سبيل المثال في التنبؤ ل LQ‏ من وزن الولادة 
وال الها كن ا سای مقارنة مماسلات الات ار الات gal GM‏ ان دريكات 7 
لكلا العاملين لها وحدة القياس نفسهاء إن أن وحدة واحدة على تدريج 2 مكافئة لانحراف 
معياري واحد على تدريج الدرجات الخام. ويتضمن هذا الافتراض أن انحراف معياري واحد 





)887.64 غم) على تدريج وزن الولادة مكافئ لانحراقاً معيارياً واحداً (9.12 نقطة) .على 
تدريج عوامل الخاض والولادة» يحتاج هذا النوع من الافتراضات الموازنة الدقيقة قبل مقارنة 
الأوزان العيارية. ویبدو أن هذا الافثراض غير واضح المعالم في المثال الحالي في أحسن 
هذه الافتراضات يمكن الدفاع عنها بدرجة أكبر. 
تقويم دقة ١‏ لتنیق: 
إحصائيات عدة لوصف دقة التنبؤ والتدوين العلمي لها وفقا لما يمليه الضمیر. وتتضمن عادة 
معاملات لکلا النوعين الاتیین: ۱ 

1. قياس ارتباطي لدقة التنبق. 

2. قياس لخطا التنبق الحتمل فى تقدیر درجات آداء الأفراد على المحك. 
معادلة تنیق العینة: 

X 2 + Dyx1 xa X1 + Cay‏ وروم 

ومعادلة التنبق للمجتمم: 

Byx2x1 X 2+ Byx1.xa X1 + Cay 

والمعادلة الأخيرة هي التي نحصل عليها Lass‏ لو حصلنا على درجات مجتمع الفحوصين 

لآ: درجة المحك الفعلية. 

'لآ: درجة المحك التنباً بها باستخدام عينة الانحدار. 

۳ درجة المحك التنباً بها باستخدام معادلة انحدار المجتمع. 

لتطوير مقياسنا لدقة التنبق خذ المواقف الافتراضية الآتية: افترض أنه يمكن استخدام 
معادلة تنبؤ العينة لحساب ۷ لكل فرد فى المجتمع ونحصل فيها على ۷. وبعدها نحسب 
مريع معامل الارتباط بين ¥و 'لا للمجتمع» ويعبر مربع معامل الارتباط هذا عن دقة الا 
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كمتنبئ للا الذي یسمی مريع معامل ارتباط الصدق المتقاطع Squared cross- validated‏ 
correlation coefficient”‏ ونرمز له A m‏ مقياس الارتباط لدقة التنبق. ويتضمن S‏ 
معامل الصدق المتقاطع معادلة تنبق العينة التي تم فحصها لجموعة غير تلك التي اشتقت 
منهاءوهى أن ,رم تخبرنا عن مدى أهمية معادلة تنب العينة عند تطبيقها على مفحوصين 
آخرين في المجتمع. ومع أن,02 ذات أهمية أولية في دراسة الصدق فمن ألمهم فهم أن مقدار 
هذا المعامل يرتبط مباشرة بمقدار معاملين إضافيين اثنين: الأول هو مربع معامل الارتباط 
التعدد (62)والذي يحدد على أنه مريع الارتباط بين لإو'لا. والمعامل ”م يقيس قوة الارتباط 
بين المحك ومجموعة من المتنيآت» والثاني هو مريع معامل الارتباط رم بين ن قيم YS‏ وقد 
بين روزبوم gj Roozeboom,1981)‏ 0ت 2م شم لذا فان قييمة م تعتمد على عاملين 
اثنين هما: 

أولاً: تعتمد على P?‏ والذي يقيس دقة التنبق ب لا إذا ما استخدمنا معادلة الجتمم» كذلك 
فن مدع قرو اتفاظ | ات معا نات 

ثانياً: ,2م وتعتمد على yo‏ ”مء أي مقیاس للتشابه بين معادلتي تنبق العينة واللجتمع. 
ویعتمد Pyr, y‏ بشکل آولي على النسبة بين حجم العينة إلى غلك ال E‏ مت هن 
النسبة صغيرة فإن رارم تکون صغيرة Leash‏ وبالتالي دقة تنبق ضعيفة كما قیست بر 2م 
الناتجة إما عن ضعف العلاقة بين الحك والتنبات أو البیانات غير الكافية لحساب الضدق مع 
التنبآت العديدة. فمن الرغوب فيه حساب کل من ۰02 ,م بمتنبئین» ویمکن حساب*م 
بالعادلة: 


Dyx2.x1 Oxo + Pyxt Dyxt x2. Ox ۳‏ مره 
5 ی سم سیب بش ی بای 
Oy‏ 

وفي مثالنا تكون قيمة ۸۶ LS‏ يأتي: 
R2‏ = 887,641 )0.006( )0.301( +9.121 )-0.247( )0.111( 
eS 6۳90۳ a‏ 
= 0.10 
وحيث يأن هذا التقدير ل02 منخفض dug‏ وأن ,02 تكون أقل Poe‏ فمن غير الضروري 
حساب,(م في هذا المثال. ونحن نعرف أنه قد يكون صغيراًء وهذا لأن ارتباط الوزن وعوامل 
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المخاض والولادة ضعيف مع مقياس سيتانفورد - بينيه عند عمر 3 سنوات. لذا ويغض النظر 
وقد طور براوني )1975 Browne,‏ طريقة لحساب ,م وتتطلب كمتيان ALR IRA)‏ 
isi‏ عتاصر 2 آولا: 





es -R2 
(Adnan ع‎ aed 


1-k-N 
حيث ترمز 6 إلى عدد المتنبآت وتساوي 2 في مثالناء و12 إلى تقدير 02 والتي تعد أقل‎ 
المعدلة.‎ R2 تقريباً. ويشار إليها عادة على آنها‎ RZ تحيزاً من‎ 


2652 - 1) K2 - 27 


COD Red 
(14K-N)(L-N) 


واستخدام الرمز Ret‏ من قبل براوني ولا يشير إلى أنه مربع Ro?‏ ويحسب مريع معامل 
ارتباط الصدق التقاطع من خلال: 


R,2+R,.4 )3- 16 -N 
3 ages eee = Rey2 
K +R. 2-6 -N) 


وفي مثالناء حساب هذه الكميات يؤدي إلى: 


01-12-01 
(iia مرچ با‎ 
1 2 - 101 
206081 -1) (2)2 - 2 (0.081 
oos- 200811) 92-2600810 r, 


(1+2 -101( )1 - 101) 
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3-2-101( )006.( + 0.081 
و پےR2‏ = )3-2-101( )006( + 0.081 _ = 0.067 


2+(0.081) (2- (2) (2) - 101) 


وكما يتبين من السافات فان RZ‏ قليلة ومشابهة في قيمتها ل ۸۶ء وتشير هذه ثانية إلى 
غياب دقة التنبق, وذلك لأن وزن الولادة ودرجة الاختبار الحركي النفسي (السيكوموتور) 
ليست متنبآت قوية لمقياس ستانفورد - بینیه, ولیس لعدم كفاية البيانات لحساب معادلة 
التبنقء وعلى القاری ملاحظة أن Re?‏ يمكن أن تكون سالبةء وإن كانت صفراً يجب تعويض 
2 بصقر في المعادلات )11 - 15( و (11 - 16). كذلك فان Rot‏ يمكن أن تكون سالبةء 
وان كانت صفراً فإنها تعوض بصفر في المعادلة )11 - 16). 

مقارنة بنتائج المثال السابق ast‏ توضيحاً آخر لاستخدام ۸2ء 12 Rég‏ اعتماداً على 
نتائج دراسة هارتلي وهارتلي )1976 (Harthley & Harthley,‏ وقد ably Laa‏ )57( طالباً 
انخرطوا في مساق مناهج البحث في علم النفس, وتالفت البيانات من )22( متنبئا واختبار 
تحصيلي لهذا المساق. وقد دونا تقدير مريع الارتباط المتعدد ل 12 )0.86( (ويبدى أنه يشير 
إلى علاقة قوية بين المحك والتنبی) . ومع ذلك فإن استخدام المعادلة (11 -14) لحساب132 
الل تجا على 2 = 0.77 , لذلك فإننا نرى أن قيمة 182 الآصلية مضللة leg‏ ما لقياس 
قوة العلاقة. ويدون مقدمات وجدنا أن R?‏ دونت على آنها تقدير لمريع ارتباط الصدق 
المتقاطع(,12): > ولكن يمكننا ومن خلال مثال هارتلي وهارتلي رؤية أن هذا يكون مضللاً. وعند 
تطبيق المعادلتين (15-11) و (11- 16) على بيانات هارتلي وهارتلي نجد أن 0.64 > Rey‏ في 
هذا SLAM‏ ومن الواضح أن انطباعنا عن دقة الصدق التنبؤي تتغير دراماتيكيا بالانتقال من 
2 إلى ,2 ISR‏ فان هذا المثال يوضح اهمية تقديرات مريع معامل الارتباط المتعدد للصدق 
التقاطم. بالإضافة إلى أن ,۸2 أقل بشكل ملحوظ من RE‏ وهذه تقترح أن جمع بياتات 
مفحوصين إضافيين يفيد في هذه الدراسة في زيادة الدقة التنبؤية لمعادلة انحدار العينة. 

وهنالك طرائق آخری لحساپ Rev‏ آحداها تستخدم دراسة صدق تقاطعي» والأسلوب 
الشائم هنا هو استخدام نصف عينة الفحوصین لحساب معادلة التنبق, وتطبیق العادلة فیما 
بعد على النصف الآخر من البیانات للحصول على قیم ۷ لهژلاء الفحوصین. ویحسب بعدها 
معامل الارتباط البسيطة بين لإ ول للحصول على تقدیر ل م وتکنن مشكلة هذه الطريقة في 
التضحية بنصف البیانات في حساب معادلة التنبق. 











مقاييس خطأ التنبؤ: 
يمكن تدوين دقة التنبق بصورة مباشرة أكثر نوعاً ما من RZ,‏ باستخدام الخطأ العياري 
للتقدير والخطأ المعياري ل ل. ومع أن الأولى أقل مرغوبية كمقياس لدقة التنبق Legs‏ إلا أنه 
یمکن آخذها بالاعتبار اولاً نها أكثر شیوعاً. ۱ 
وقد تم تقدیم الصيغة الرياضية لحساب القطا العياري للتقدیر لتنبی واحد مع مثال 
رياضي في الفصل الثاني. وثانية مع تفسیر الاستخدام في دراسات الصدق في الفصل 
التاسع. ویحسب الخطاً العياري للتقدیر لعدة متنبآت بالعادلة: 


2. 1-3۱ 4 
Fe RPT) ody بين = راد‎ 


ويشير الخطأ تحت × إلى وجود أكثر من متنبی» و ۸۶ تمثل مريع الارتباط المتعدد 
يأتي: 


18.355 = (0.1 - 1) (370.601) 100۱ _ م‎ 
99 ii 


ومع أن Oxy‏ واسعة الاستخدام في تقدير خطأ التنبؤ إلا أنها قيمة مُغالی فيها لدرجة دقة 
التتبق, وذلك لأنها لا تعكس حقيقة أنه ولأي مفحوص Y`‏ (القيمة التنبا بها من بيانات العينة) 
تعد فقط تقدير ل ۰۷ (القيمة التنباً بها من بيانات المجتمع). 

ويمكن كتابة tha‏ التنبق 28 = ۲۷-۷ على النحو الآثى: 

)18 د نو - ) +( -` وراه‎ E 

حيث يعكس الفرق CY-Y)‏ الفجوة بين لا الحقيقية والتنبق ب لا من بيانات الجتمم» وتعكس 
(y'-y)‏ الفجوة بين قيمة ل التنباً بها من بيانات المجتمع وقيمة ۲ التنباً بها من بيانات العينة 
العياري ويحسب من 


1 1 1 ۸ ۳-1 = SE, 
و‎ pT ۱ + +1 | (R2-1) 62. —— 
١ (Pxixetz2 2- z +Z?) (Pxix2 -1( (N-T) N ۱ ( ye Y N-2 A 
9-11) 
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جدول )2-11( الأخطاء المعيارية ل ۷ لتجمعات21و Z2‏ 





0.111- = Pyix2=: 101 =N 
قيم 2 = - 1 أو -2 لا تظهر في البيانات الفعلية التي اعتمد عليها هذا الجدول.‎ ca 


۸ ۸ 
وتمثل EF pei‏ الارتیاط بين یکی را gs‏ = لت Ng‏ عدد 
Xi‏ 


الفحوصين في العينة. ويبين جدول )2-11( قيمة هذا الإحصائي لتجمعات متنوعة من 
الدرجات في الوزن عند الولادة والاختبار السيكومتري للأطفال الرضع. وبتفیجص جدول11- 
2 يتبين لنا أن التنبق يكون أكثر دقة للمفحوصين الذين درجاتهم قريبة من المتوسط على كلا 
المتنيئين وأقل دقة للمفحوصين الذين تبعد برعاي عن و aes‏ التنبئین. وفي هذا 
المثال Y‏ يتغير الخطأ المعياري ل 'لز دراماتيكياً بتغير :2 و Zp‏ وذلك لانخفاض قيمة Paix‏ 
والكبر النسبي لحجم العينة, وهذا لا يظهر في حالات أخرى. ويبين الجدول (3-11) قيم 
thal‏ المعياري ل ل التي قد تظهر مع مرم = -0.707 و N‏ = 30 وفي هذه الحالة يكون 
ZiZa i‏ أكثر دراماتيكياً . ۱ 

ويمكن استخدام الخطأ المعياري WU‏ في تكوين فترأت تنبق للمفحوصین» فعندما يكون 
حچم العينة آکبر من ۰30 فان الفاحص يمكن أن يبني فترة ۷ + SEY‏ ويتأكيد نسبته9068 
بان قيمة ۷ الحقيقية تقم ضمن هذه الفترةومن الدهش ملاحظة أن التقدیر العياري 1 ۷ 
يتأثر بشکل أساسي بقیم ررم و N‏ وفي الوقت نفسه عدم تأثر الخطأ العياري للتقدیر 
الحسوپ بالعادلة )7-11( بخصائص العينة هذى وبالتالي فانه بعد غير دقیق. 
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721, 72 ۰ الأخطاء العيارية ل 'لآ لتجمعات‎ (3-11) fous 





.30=N‏ ى ,م-0.707 


X1X2 


انيو یا 7 ستخدام أكثر من متنبكين اتنین: 
يمكن LES‏ معادلة تثبق العينة عندما يستخدم أكثر من متنبئین أثنين على النحو الآتي: 
byxk Kij ee +X UX] vee Dyxix2tC £y)‏ ...< لگ Xk‏ 20-11(۰) 
ویرمز C‏ القاطع و 96 لعاملات الاتحدار لتغیرات عددها K‏ والحرفین علی يسار 
ا a‏ طرق Lage‏ العاین والحروف 
إلى یمین النقطة تشیر إلى التتبات الاغری في العادلة. ومثال محسوس لعادلة القنبق AS‏ 
من متغيرين: افترض أنه بالاضافة إلى الوزن عند الولادة ر0 والدرجات علی عوامل الخاض 
والولادة (Kp)‏ في الشال السابق, لدینا بیانات عن عمر الأم عند ولادة الطفل (K3)‏ والحالة 
الاجتماعية الاقتصادية (KOAU‏ وبالتالي فان معادلة انحدار العينة تکون: 
DYx4, x1x2x3 X44 byx3. x1x2x4 X3 + DYx2. x1x3x4 X2+ bYx1. x2x3x4 X1 + C= 1‏ 
ويوجود أكثر من متنیتین» فان حساب معاملات الانحدار و يكون ges‏ وعادة يجري 


=== 339 





























ميهج وب 























س 340 








اختیار المجموعة الفرعية للمتنبئ: 

عندما يتوافر اثنان أو أكثر من التنبآت» فمن الهم الأخذ بالاعتبار ما إذا كانت مجموعة 
المتنبآت الفرعية ستعطي دقة تنبؤية قريبة من تلك لمجموعة المتنبآت جميعها. بالمقابل فإن 
مجموعة فرعية منها يمكن أن تؤدي إلى دقة تنبق أكثر من تلك الناتجة عن المجموعة الكلية 
(Hocking, 1976)‏ . والسبب في محاولة ایجاد مثل هذه المجموعة الفرعية لإلغاء جمع بيانات 
على متنبآت تساهم بقلیل أو لا تساهم بدقة التنبق. فعلی سبیل المثال قد یکون هنالك ارتباطاً 
عالياً لمجموعتين مع محك الاداء» وفي هذه الحالة فلا داعي لتضييع الوقت والجهد والكلفة في 

افترض وفي مثالنا السابق أن الباحث اختار مجموعة فرعية من المتنبآت الفعالة للقياس 
ولها دقة تنبؤية معقولة. وهنالك العديد من التقنيات الممكنة لاختيار المتنبئ ولكن تقنية واحدة 
تعرف ب: اتحدارات المجموعات الفرعية الممكنة جميعهاء وهذه سيتم عرضها هنا. والمهتم 
بتفاصيل أكثر لهذه التقنية وتقنيات اختیار المتغير الأخرى يمكنه الرجوع إلى هوكنج (Hock-‏ 
ing, 1976)‏ والذي قدم مراجعة واسعة للطرائق والقضايا المتعلقة في اختيار المتغيرات. وكما 
يشير الاسم يستخدم انحدار المجموعات الفرعية الممكنة جميعها في حساب دقة التتبق لكل 
تجمع ممكن للمتنبآت. وتستخدم هذه النتائج فيما بعد في الإرشاد لاختيار مجموعة ملائمة 
من التشات. ویعرض جدول (4-11) نتائج تحلیل انحدار للجموعات الحتملة جمیعها 
لتفیرات الوزن عند الولادة وعوامل الخاض والولادة وعمر الأم وحالة الأم الاجتماعية 
الاقتصادية کمتنبات لقیاس ستانفورد - بینیه 

ویدون الجدول قیم 122 لكل تجمع محتمل لتنبی واحد. أو اثنين أو ثلاثة أو آريعة. 

وتشیر هذه النتائج إلى أن RZ,‏ لنموذج التغیرات الأربعة آنها آکبر قليلاً من182 للعدید من 
نمانج التغیرین الاثنين» لذا فإن النموذج بمتغیرین اثنين من التنبأت الاربعة الحتملة يبدو 
مناسباً. ولأن الفروق قليلة بين إحصائيات R?‏ لأفضل ثلاثة نماذج التغیرین الاثنين» وأن SES‏ 
مستخدم فيها جميعاًء لذا يقترح نتيجة ذلك أن الجمع بين أي من المتغيرات الثلاثة المتبقية مع 
5 تزودنا باختيار مناسب عبر المتنبآت الأريعة. كذلك تم تدوين قيم معاملات Ro‏ في 
الجدول نفسه لاثبات أنه ويزيادة عدد المتغيرات (K)‏ فإن R%‏ تصل إلى قمة قصوى ثم 
تنخفضء كذلك فإن ہے۸ سيصل آعلی قيمة عند قيمة K‏ نفسها. 

وكنتاج: قانون معقول لاختيار المتغيرات هو اختيار عدد من التنبأت التي ينتج عنها أكبر 
قيمة ل RZ‏ ويشير هذا القانون ثانية إلى اختيار متنبتین اثنين. l‏ 














Jaa‏ (4-11): نتاكج تحليل الانحدار للمجموعات الفرعية المحتملة جمعیها. 





تحليل النمییز: 
نواجه أحياناً في دراسات الصدق تطوير طريقة لاستخدام بيانات الاختبار في تصنيف 
المفحوصين إلى مجموعتين أو أكثر. فعلى سبيل المثال افترض أن مستشفى معين صنف 
, مرضاه إلى فئتین شيزوفرانيا وكآبة» اعتماداً على مقابلات تحليلية. وتتطلب عملية المقابلة 
' عدداً كبيراً من المحللين والكثير من وقتهم. فقد يكون من الأهمية بمكان التحقق من صدق 
بطارية اختبارات فرعية تقيس اضطرابات التفكير "Thinking disturbance"‏ والتخلف 
withdrawal distursbance"‏ والانس حاب العدواني “hostile suspiciousness"‏ وقلق 
الاحیاط "anxious depression”‏ وقدم JS‏ من کلینباوکویر (anxinbaum & Kupper, )i95‏ 
)1978 بيانات افتراضية للحالة الموصوفة اعلاه. 
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جدول (5-11): بيانات توضيحية للتحليل التميزي: 








(North Scituate: Duxbury Press) المتغيرات‎ 


oe I eels ۱‏ من فيل اتحالن التفسيية والدزسات على aay al‏ ك فل ناه 
۱ الملاحظة علی التغیرات الاربعة. وتم حساب الدرجات على من الدرجات على 1توحتی 24 
| ؛ وكانت الطريقة التبعة على النصو الاتي: يبدا تحلیل التمییز من درجات الفحوصین في 
العينة الذين تصنيفهم الصحيح معروف. واستخدمت هذه الدرجات لحساب أوزان المتغيرات 
poe ۱‏ فعروف: وفی JEW‏ الحالی: (ea‏ يمني أن ola‏ على Kj‏ وحتی aamua Ky‏ 
لتحدید آوزان التمییز 0,2,, وذلك للمجموع الخطی الوزون: 


dy4 + وين‎ + Dygt ayy =Y 
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ويعرف الجمع الخطي هذا باسم دالة التمييزء وهال ما تتحدد قيم 6,0,۸, فإنها تستخدم 
في حساب قيمة ل للمرضى الذين لم يتم مقابلتهم من قبل الحلل النفسي. وعلى القاری أن 
يلحظ وجه الشبه بين الاستخدام القصود لتحليل التمییز» واستخدامنا في البداية لتحليل 
الاتحدار المتعدد. ففي الأخير كان الهدف استخدام العينة لتحديد معادلة يمكن استخدامها 
jill‏ بدرجات المحك للمفحوصين مستقبلاًء بينما في الأولى كان الهدف تطوير معادلة يمكن 
استخدامها في تصنيف المفحوصين مستقبلاً. ويما أن ل تستخدم في تصنيف المفحوصين, 
فإنه يجب تكوين مجموعتين مختلفتين لأقصى قدر ممكن على لا. وقياس طبيعي للفرق بين 
المجموعتين هو: 
وباك Te E‏ 


۸ 


oy 


وتمثل الكمية y‏ الفرق في المتوسط المعياري بين المجموعتين (الكآبة والشيزوفرانيا)» والحك 
العتمد فى اختيار أوزان 1,0,0,2 وكذلك ۷2 أن تكون أكير ما يمكن. 


جدول (6-11): المعاملات لدوال التحليل النفسي والتمییز 





والطريقة الرياضية المستخدمة في تحديد الأوزان ليست من أهداف هذا الکتاب وللمهتم 
يمكن أن يجدها في كليناوم وكوير (1980). 

وفي مثالنا كانت الأوزان كما يأتي: 

y .مد 1.15 4= 0.51- لذا فانه وللمریض الأول (الکابة). فان‎ 161 =b. -3.22=a 
: تکون‎ 


== 3 


















































(10.22) (0.51-) + )6.6(1.15 + (6.4) 1.61 + (5.0) (3.22-) = y 
3.41 = 


والدرجات علی معادلة دالة التمییز للمرضی AN‏ مبينة في جدول (5-11). وواضی آن 
مرضی LIS!‏ تکون درجاتهم أعلى من مرضی الشیزوفرانیا فمتوسط درجة Us‏ التمیین 
ارخ الکابة 20۳ ,ولزضی الشيؤوفرانيا س2 11 . ومدا شرع ان مالك tact‏ ةة 
اتصنیف الرضی تستخدم متوسط التوسطین ومن ثم تصنیف أي مریض من خلال درجة دالة 
التمییز» وتصنیف أي مریض دالة التمیین له آعلی من الوسط على أنه مریض LIS‏ ومتوسط 
التوسطین هو: 

-6.6 = 2 / ])2.0-( + 11.2-] 


وعلى هذا فان أي مريض درجته أعلى من -6.6. يصنف على انه مريض LUIS‏ والآخرين 
یصنفوا على أنهم مرضى شیزوفرانیا(). 

Ulag‏ يتم تطوير القانون فمن الهم تقويم دقته. وطريقة بسيطة مصاحبة لهذا هو استخدام 
القانون في تصنيف المرضى الذين طور القانون من خلالهم. وحيث أن المرضى الذين 
درجاتهم أعلى من (-6.6) صنفوا على أنهم مرضى LLS‏ والآخرين على أنهم مرضى 
شيزوفرانياء وهذه الطريقة صنفت الجميع إلى مرضى TIS‏ عدا الأخير فكان شیزوفرانیا. 
ويمكن عرض هذه النتيجة في جدول مثل جدول )6-11( واعتماداً على هذا الجدول فان 
E EA‏ الحسوي ELS‏ مسفن Wil ey‏ 78202 

والمشكلة في تقويم قانون التصنيف مع البيانات التى اعتمدت عليها هو احتمال أن تكون 
الدقة مغالى فيها. وهتالك اسلوپان للتغلب على هذه المشكلة. الأول هو تطبيق القانون علی  ٠‏ 
مجموعة مرضى لم تستخدم في تطوير القانون وإحدى الإجراءات المستخدمة هي تطوير 
القانون من خلال نصف البيانات المتوافرة وتقييمه من خلال النصف الآخر. وهذه الطريقة 
مشابهة لطريقة الصدق التقاطع الوصوفة في تقويم دقة التنبق لمعادلات الانحدار المتعدد: 
وتشترك معها في أنه يتم إهمال نصف البیانات. والثاني مشابه لطريقة براوني في تقدير 
الصدق التقاطع» وقد وصف كل من کلینباوم وکویر(1978) وموريسون )1976 (Morrison,‏ مثل 
هذه الطرائق. 








(3) يستخدم متوسط التوسط على افتراض انه وفي المجتمع الذي سيتم تطبيق القانون عليه, تتوافر حالات كثيرة لكلا الرضین 
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وفي المثال السابق كان الهدف تطوير طريقة تصنيفء مع اهمام قليل بالتفسير الحقيقي 
لاوزان التمييز .مع ذلك افترض أن البطارية طورت لتقويم فاعلية العلاج السايكايتري (التحليل 
النفسي)» والنظرية التي يقترحها تطوير الاختبار هو أن البطارية يجب أن تميز بين مرضى 
الكابة ومرضى الشيزوفرانيا. بالإضافة أنه يمكن تمييز هاتين المجموعتين بدقة في اضطراب 
التفكير وقلق الإحباط مع ممارسة اضطراب التفكير بدرجة اكبر وقلق الإحباط بدرجة أقل 
لمرضى الشیروفرانیا وقي هذا الموقف يوجد نوع من الاهتمام في تفسير لء إذ إن ۷ هي 
المتغير الذي يميز بأقصى قدر بين الجموعتین» وتفسير ل مرتبط بصدق بناء البطارية. 

وعندما یکون هدف التحلیل تفسیر الفرق بين الجموعتین فان هنالك العدید من 
الاحصائیات الناسبة. وقد قدم بري وماکسویل (Bray & Maxwell,1982)‏ مراجعة کاملة لهذه 
الاحصائیات. وسیتم هنا فقط عرض للاحصائیات التي يعتقد آنها الاکثر آهمية في توضیح 
العنی الأساسي لدالة التمییز والطريقة ASY‏ شیوعاً لاستخدام دالة التمییز في تفسير 
الفروق بين الجموعات هو فحص آوزان التمییز. والاستدلال بوساطة هذا الأسلوب يمكن رژیته 
من خلال إعادة النظر لدالة التمييز في الثال الحالي معادلة دالة التمییز هي: 

(CLE hs eae X4d + X3C + 2620 + 518 =Y 

ومن الواضح أن المتغير ذا آکبر وزن تمييزي له تأثير أكبر في › وذلك أن التغير بقيمة 
معينة على هذا المتغير تؤدي إلى اكبر تغيير في لا . وللتوضيح تذكر أن التعويض dicba‏ 
يؤدي على: 

X4 )0.51 (+ 221.15 + X 1.61 +X; 3.22-=y 

وبالتالي فان التغیر نقطة واحدة على Ky‏ تؤدي إلى آکبر تغیر في ل من التغیر نقطة واحدة 
على Xp‏ آو Xa si X3‏ لذا قان Ky‏ تفسر على آنها لها آکبر تأثیر في لاء و 4 × لها أقل تأثیر. 
والاستنتاج سیکون هو نفسه بغض النظر عن قيمة التغير الحاصل في ال × 

والمشكلة في هذا الاسلوب أنه یفترض أن التغیر نقطة واحدة على ال ,× من بعض 
الوجوه مكافيء للتغير نقطة واحدة على أي من ال ,× الأخرى. بمعنی آخر آنها تفترض 
تساوي وحدة القیاس للمتغیرات جميعهاء ومن الواضح أن هذا الافتراض خاطی في معظم 
التطییقات. 

ولحاولة الاحاطة بهذه المشكلة فان عدداً من الفاحصین حسبوا الأوزان التي قد تنتج فیما 
لو أجري تقنین أو معايرة لكل XK‏ وهذه الأوزان تعرف بأوزان التمییز العيارية, واعتبرت عند 
العدید Gal‏ قابلة للمقارنة من ga gable‏ 
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وفي مثالنا الأوزان المعيارية هي -4.89, 1.17 , 2.56 و -1.18 وعلى أساس هذه الأوزان 
فإن اضطراب التفكير بقي المساهم الأكبر في دالة التمييزء مع أن مساهمته بالنسبة للاعاقة 
والشك العدواني كان أكبر في حالة الأوزان المعيارية عنه في الأوزان الأصلية. ومن جهة 
آخری فإن مقدار مساهمته بالنسبة لقلق الإحباط حكم على انه آقل. 


Sell dls تفي‎ SN 


الوم >3 + وورم + وورم Pisat‏ وت رز سای | 

حيث تمثل 0*5 على الجهة الیسری الارتباط اللحسوب بمعالجة جميع البيانات كما لو آنها 
مجموعة واحدة. لذا فانه لحساب الارتباط بين دالة التمییز والتغیر فان الارتباط بین هذا 
التقير والتغیرات Gil‏ جمیدها تضرب بالوزن التمييزي للمتغير الآخرء وتجمع هذه النتائج 
فيما بعد ويضاف إليها وزن المتغير قيد الدراسة. وفي مثالنا كان الارتباط بين لاو × حتى 
X4‏ على النحى الآتي: -0.89 ۰- 0.34 , -0.35 ۰ 0.78 على التوالي . لذا فان دالة ا 
لمرضى الشيزوفرانيا تميل لأن تكون درجاتها منخفضة: وتظهر ارتباطاً سالباً مع اضطراب ٠‏ 
التفكير وايجابي مع قلق الاحباط 

وفي الاختيار بين آوزان التمييز المعيارية وارتباطات دالة التمييز- أوزان التمييز فمن المهم 
التمييز بين هذين الإحصائيين والذي يجيب كل منهما عن أسئلة مختلفة (Bray & Maxwell‏ 
(1982, وتلخص أوزان التمييز التأثير المفرد للمتغير على دالة التميز, في حين أن الارتباطات 
تعب و عن الوا نارن بين المتغير ودالة التمییز. Galas‏ كل من بري وماكسويل على أن 
الارتباطات تعد مرشداً أفضل للتفسير الجوهري لدالة التمييز. 


مع أكثر من مجموعتين: 


يمكن توسيع استخدام تحليل aaa‏ تستخدم فيه مجموعات عدة. فعندما يكون 
لدينا مجموعتان فقط فان دالة تمييز واحدة تعزى للفروق جميعها بين المتغيرات ومع ذلك 
سنهتم بدراسة الفروق عبر عدة مجموعات» وسيتبين لنا أن الفروق بين المجموعات لا تكون 
مقدمة بشكل مناسب في دالة التمييز الأولى» فبعض الجموعات المختلفة بالفعل بالمتغيرات 
الأصلية قد تظهر متشابهة على دالة التمییز الأولى. وفي مثل هذا الموقف نحتاج لأكثر من دالة 
تمييز واحدة لتفسير الفروق بين الجموعات. وفي هذه الحالة فان دالة التمييز الثانية عبارة 








بدالة التمييز الأولىء وهذه تعظم الفروق ic‏ الجموعات. وستکون دالة التميين Fim jee)‏ عبارة 
عن الرکب آلوزون وشن الرتبط مع اي من الدالتین الاولی والثانية. هذه تزودنا باقصی فصل 
بين الجموعات. وأكبر عدد ممکن من دوال التمییز يساوي عدد التغیرات p‏ آو آقل بواحد من 
عدد الجموعات والتي هي آقل. وقد asd‏ کل من کلینباوم وکویر(1978) وموریسون(1976) طريقة ٠‏ 
وقدم بري وماکسویل )1982( مثالاً لاستخدام تحلیل التمییز التعدد لتفسیر الفروق عبر آربع 


Sus قرا‎ ehali) 


)2( صعوبات قرائية متوسطة. 


)3( قارئین متوسطین. 
(4) قارئین متميزين. ولهولاء الأطفال تم الحصول علق درجات على التغیرات المحكية 
sy‏ 


اختبار القراءة اللفظية (PPVT) peal!‏ اختبار الذكاء اللفظي العام. اختبار الطلاقة 
VE) a deal‏ مار le‏ اع عل سياس lth,‏ ره شيل E‏ الا 
الابتدائية (SIM)‏ اخبتارين في القدرة القرائية, اختبار التكامل الحركي البصري (VMD)‏ 
واختبار المعرفة -التمييز(8)ء وكلاً من الاختبار غير اللفظي العام واختبار الشكل (BF)‏ والتي 
تقیس القدرات غير اللفظية العالية. أظهر تحلیل التمييز دالتى تمييز لها دلالة احصائية. ومن 
خلال الأوزان المعيارية للتميين على آنها العاملات فان دالتي التمييز كانتا على النحو الآتي: 
Y 0.15 (PPVT) + 0.10 (RD) + 0.39 (BF) + 0.33 5 (VF) + 0.29 (VMI) +‏ 

0.44 (SIM) ۱ 

Y = 0.95 (PPVT) + (-0.51) (RD) + (-0.58) (BF) + 0.37 (VE) + 0.12 (VMI) + ` 
(-0.2) (SIM) 


وتشير الأوزان العيارية للتمييز على أن المتغيرات (SIM, VEER)‏ هي الأكثر أهمية في 
Ea‏ ين العاف في الذالة YN‏ ته في MUG‏ تایه كان Goel‏ ناکین 1 
1 ومساهمة عالية لا وزن كل من RD‏ و ۴٤و VE‏ 
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التغیرات جميعهاء والعلاقات الأقوى كانت ل 8۴ى SIM‏ والعلاقة بين دالة التمييز الأولى 
والمتغيرات المتبقية متساوية في قوتها تقريباً. ودالة التميبز الثانية كان ارتباطها موجب مع كل 
من PPVT‏ و ۷۲وسالب BFy RDps‏ وبشكل أساسي لا ارتباط مع SIMSVMI‏ ویظهر 
متغير التمییز الثاني القابلة بين قدرات التمييز اللفظية والبصرية. 


حدول (7-11): معاملات figs‏ التمديز Slik‏ بري - ماکسویل. 





مأخوذ عن بري وماکسویل. تحلیل وتفسیر تحلیل التباین التعدد. Reviewal Educe.‏ 
Research, 52‏ ۱ 

وعندما يكون هناك أكثر من دالة تمييز معنوية. فإن متوسط دوال المجموعات يمكن تمثيله 
بيانياً كدليل في تفسير دوال التمييز وطبيعة الفروق بين الجموعات. ويمثل الشكل (1-11) 
رسم بياني لتوسط المجموعة على دوال التمييز لمجموعات القراءة الأريع» والنقطة الموضوعة 
مع اسم المجموعة تمثل متوسطات درجات تلك الجموعة على دالتي التمييز. وهذه النقطة على 
التمثیل البياني يطلق عليها اسم مجموعة المركز Centroid"‏ 02090" وهنه النقطة والخطوط 
المنبثقة عنها هى مركز العينة الكلية. ومن الواضح أن دالة التمییز الأولى تفصل کل مجموعة 
عن غيرها من الجموعات, وتمیز دالة التمییز الثانية القارئین التمیزین عن الجموعات الثلاث 
الأخرى»ء ومن المکن تمثیل القیاسات على التغیر الاصلي من خلال متجهات. لذا فإنه یمکن 
تكوين تفسیر لدی الاختلاف بين المجموعات على هذه التغیرات. مثل هذه التجهات تشير إلى 
المجموعات ذات أعلى مستويات متوسط على المتغيرات الأصليةء وبعيداً عن المجموعات التي 
لها أدنى مستويات متوسط. ويشير طول كل متجه إلى فعاليته التمييزية عبر المجموعات (انظر 
Overall & Klett‏ لبيان طريقة الرسم) ویمکننا رؤية ومن خلال موقع المتجهات أن PPVT‏ 





عرو يشكل اساي ين القارقي ea call‏ عن الجنوعات BR; ye nV‏ یل للت jas‏ 
الجموعات جمیعهاء ولکنها بشکل خاص قمیز مجموعة الصعویات الشديدة عن الجموعات 
الأخرى. 

وكما هو الحال لدالة التمييز الواحدةء فان دوال التمييز المتعددة يمكن استخدامها 
لتصنيف الأفراد إلى مجموعات على أساس درجاتها على دوال التمييز. والخطوة الأولى تكمن 
في استخدام العينة لتقدير دوال التمييز ومتوسط كل مجموعة على كل دالة من دوال التمییز. 
ولتصنيف مفحوص جديد تحسب درجات دالة التمييز للمفحوص ثم نحسب السافة بين هذه 
الدرجات, وکذلك پدسب مرکز کل مجموعة, ثم یصنف الفحوص کواحد من اعضاء الجموعة 
التي یکون مرکزها آقرب لدرجات دالة تمییز الفحوص نفسه. 


1.5 
۱.0 
o Superior 
PPVT 
VF 
9 7 SIM 
YMI 
0.0 
Average 

“0.5 سا‎ Severe Mild 

“4.0 


MK‏ یواسم شم سس 
LS‏ 1.0 05 ۵0 05“ 10- وا 


شكل (1-11): شكل المجموعات في الفضاء التمييزي. 
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. المفحوصين النفردین فإنه يوجد إخصائيين اثنين مه ين هنا 
oe |‏ للتقدیر .العياري O) J‏ ويفضل ee‏ العياري í.‏ 





1/استخدم اختبار مینسوتا لتقييم القراءة (MIRA)‏ لتقييم مهارات القراءة لطلبة كليات 
الجتمع» وكلية إدارة الأعمال والعاهد المهنية التربوية الثانوية وما بعد الثانوية» بينما 
صمم اختبار ستانفورد للمهارات الأكاديمية (TASK)‏ للطلبة في الصفوف من الثامن 
إلى الشالت عشر. sly‏ طبق کل من براون وشسانغ (1982) اختبارات القترابة 
الفرعية MRA‏ و TASK‏ على )50( من الطلبة النخرطین فى العاهد الهنية التقنية. 
وفك Ga aod tol‏ فتوسظای الظلبة ودرا مصضفوفه ااریاطات ليذ اقفن اك 
التلاثة: 
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احسب وفسر الارتباط الجزئي بين MRA‏ و GPA‏ بضبط ‘TASK‏ 


2/ في المثال المتعلق بدراسة هارتلي وهارتلي (1976) كانت نسية حجم العينة إلى التنبی 
9 1ء وأقل بکثیر من القانون التجريبي القترح وهو 10: ۰1 وقيمة R۶‏ المدونة = 
6 و Roy?‏ الدونة 0.64 ویقترح هذا المثال أن النسبة القليلة لحجم العينة للمتنبی 
لها أثر على الصدق التقاطعي. احسب 2ہی R‏ الناظرة ل 0.50۳82 و 0.7082 لوقف 
عدد مفحوصين )57( ومتنباته )22( (si)‏ عدد المفحوصين والمتنيآت لدراسة هارتلي 
وهارتلي/) jibe‏ يمكن أن تستنتج عن أنواع المواقف التي يكون فيها نسية المفحصوصين 
إلى المتنيئين من 3 إلى 1 معدا بدلالة الصدق التقاطعي. 

3/ دون تشيسوم وهوینز )1976 (Chissom & Hoenes,‏ المتوسطات والانحرافات المعيارية 
والارتباطات لاختباري ذكاء متحررين من الثقافة: اختبار 48-«آواختبار الذكاء المتحرر 
من الثقافة (CFIT)‏ والاختبار التحصيلي لرابطة الأبحاث العلمية SRA‏ على )150( 
طالباً في الصف الثامن. وکانت مصفوفة الارتباطات وامتوسطات والانحرافات المعيارية 
على النحو الآتي: 








آ- آسش معادلة انحدار التنبق يب SRA‏ من D-48‏ و -CFIT‏ 

ب- ما درجة SRA‏ التنباً بها لطالب درجته 30 عل 48 D-‏ و 20 على -CFIT‏ 

ج- احسب الخطاً العياري للتقدير. 

د- في أي مدی من ola pull‏ يمكن أن تکون نسبة الثقة %68 لدرجة SRA‏ لطالب درجته 
0 على 48 - D‏ و 20 على CFIT‏ (یمکنك استخدام الخطأ العياري للتقدیر في الإجابة 
عن هذا السوال). 

ه- باستخدام البيانات المتوافرة, هل أن الخطأ العياري للتقدير مُغالى فيه بدلالة دقة 
التنيقٌ المعتمد على معادلة انحدار العینة؟ SHOU‏ 
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a‏ لمي tp‏ ييا tee‏ لم داعي ل لص سیپس 





للشرب غير المضبوط خلال مدة ستة أشهر بعد خروجه من المصحة. ومن خلال 
مقابلات أجريت بعد ستة أشهر من الخروج وجد أن (10) مرضى كانوا مضبوطين في 
wil‏ ان وم (10) (eas‏ على انهم ارون عون halon Ba‏ وت افرت eabar‏ 
)5( متغیرات قیست آثناء القابلة الابتدائية. وهذه التغیرات هی: اختبار متشغان لغريلة 

usta ©‏ باتک E E COO ah alco sual‏ على سای شرع 
الضبط الداخلي - الخارجي لروتر (X3)‏ والتعليم (X4)‏ والعمر عند أول مرة شرب 
(265)وفیما يأتي البیانات المستخدمة في حساب دالة التمیین: 





3 سب 





























ونتج عن هذه البيانات دالة التمييز الآتية؛ 

Xo - 0.01 X5 + .14 X4 + 0.09 5‏ 40. + بز 34, - Y=‏ 
1- استخدم هذه المعادلة في تطوير طريقة 3 لتصئيف الرضی مستقبلاً. 
ب- كمشرف على مصحة معالجة مدمني الكحول كيف تستخدم هذه المعادلة. 
سب لخست دقة هذا القائرن يتطبيفه Me‏ انات اة 


alls, /5‏ مقياس تقدير السلوك الأولي لدیقروکس (Devereux) (DBRS)‏ )47( فقرة 
صممت لتمثل الدی الكامل لسلوكات الطلبة التي تظهر في الصفوف المنتظمة. وينتج 
عن تصحیح المقياس )11( درجة اختبار فرعيةء والدرجات العالية في المقاييس جميعها 
(عدا الاستيعاب والمبادرات الإبداعية). تمثل سلوك اقل ايجابية. وتم قياس )217( طالباً 
في الصف السادس (تضمنوا طلبة التخصص الرئيسي بالإضافة إلى (184) طالباً 
منتظماً) من قبل المعلمين على مقياس تقدير السلوك الأولي (DBRS)‏ وكان متوسط 
طلبة التخصص الرئيسي أعلى من متوسط الطلبة المتضمنين على الاختبارات الفرعية 
جميعها عدا الاستیعاب. والفروق الأقل كانت على اختبار الحاجة إلى الحميمية 

اقا اليادوات الإبداعية. وحللت البيانات باستخدام تحليل التمییز, وفيما يأتي 

أوزانا لتمييز العيارية (SDW)‏ ومعاملات الارتباط التمييزي. اكتب تفسيراً مختصراأ 
متغير التمييزء وماذا تقترح هذا فيما يتعلق بإدراك المعلمين للفوارق بين طلبة التخصص 
الرئيسي والطلبة ee‏ 











ی اللو ل میت ٠‏ يس رسيي L‏ و یمهم e‏ میور ا ا 20 E‏ ال ی pai,‏ بع من Pico, “Rapala: sant? <n‏ 




















الفصل الثاني عشر 
التحيزفي الاختيار 
ظهرت في أواخر الستينات قضية استخدام الاختبارات في الاختيار للوظيفة وفي 
المؤسسات التريوية. ويدأ يظهر الاهتمام المتزايد في الدراسات السیکومترية. ومع أن قضية 
تحيز درجات الاختبار شغلت بال مطوري الاختبارات ومستخدميهاء إلا أنه لا توجد صياغة_ 
واه vera (er‏ الاختبان يمكن تطبیقها بموضوعية للكشف عن تأثيره أوحذف هذا 
التأثير في مواقف الاختبارء وقي البداية كانت الحاولات لتطوير تعريف تحيز الاختبار من 
خلال خطوط الاتصدار وذلك التق عن lull‏ بوساطة درجات الاختبار فى مجموعات 
الفموضین الرئيسیة والفرمية (لراجمة استخدام خطوط الانحدار انظر الفصلین Al‏ 
والحادي عشر)» وللاهتمام بمثل هذه الأهداف فإن التعریف الاحصائي لتحیز الاختبار یأمل 
بناء اختبارات یحذف منها التحیز في عملية الاختیار. ومع ذلك فإن خط الهجوم هذا انخفض 
قوراً في وجه النمو التزاید لقضية التحیز في الاختیار» وعدت على آنها مسالة قیم سياسية 
اجتماعية. ویغض النظر عن طريقة مقارنة خطوط الانحدار بين الجموعات الرئيسة والفرعية 
فإن طريقة الاختیار آو قانونه يمكن اقتراحها لتحقق أية آهداف سياسية اجتماعية بالقابل. 
اقترحت العدید من طرائق الاختیار لتعکس مواقف قيمية مختلفة حول عدالة الاختیار. 
وپتتبع هذا التطور فان العدید من المؤلفين: 
(Cronbach, 1976, Gross & su, 1975, Petersons Novick, 1976)‏ 


أشاروا إلى ملائمة نظرية القرار لتطوير طرائق العدالة في الاختیار» ويتوافر الآن اتفاق 
أساسي على أن نظرية القرار تزودنا بأسلوب نسبي وتقني. وكنتيجةء فإن العديد من طرائق 
الاختيار المبكرة التي كانت صياغتها على غير طريقة نظرية القرار لم تستمر تطبيقاتها طويلاًء 
ومع ذلك فإن فهم الكتابات الحالية في القياس المتعلقة Seal‏ في الاختيار تتطلب معرفة 
بعض المحاولات المبكرة لتعريف التحيز ولتطوير نماذج اختيار تسبق تلك التي اعتمدت نظرية 
القرار» كذلك إضافة إلى الحديث عن تاريخ هذه التعريفات وطر ائق الاختیار. فان هذا الفصل 
يقدم مدخلاً إلى نظرية القرار واستخداماتها في مشكلات الاختيارء وقبل البدء باي من هذه 
الوضوعات يجب علينا أن نقدم تعريفاً لبعض المصطلحات والفاهیم الأساسية. 
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مفاهيم ومصطلحات أساسية: 

في الیدء. Les‏ نركز على اختيار مغحوصين من مجموعة وأحدة ویوضح شکل (11-12) 
تمثیلاً بيانياً اعتماداً على درجات الاختبار X‏ ودرجات الحك ۰۷ وهذا مشابه لما نحصل عليه 
إلى مجموعتين (ناجحة وراسبة) وکما هو موضح في الرسم البياني في الشکل )12 - (ol‏ 
افترض LAT‏ أنه تم اختیار قطع على محور السینات بحيث یمکن اختیار الفحوص للبرنامج 
إذا كانت درجته على درجة القطع أى أعلى منهاء Laf‏ أن كانت dia jd‏ دون هذه الدرجة فانه 
محتملتان, أما نجاح أو فشل فى الحك. كذلك فان هنالك قراران محتملان بالاعتماد على 
المتنبيء: القبول أو الرفضء وينتج عن الارتباطات الممكنة بين النتاجين وبديلي القرار أريعة 
احداث ممكنة تمثلها الرباعيات المبنية في الرسم البياني في الشكل (12 - (al‏ ويتضمن 
الريع الأول الذي يرمز له بالرمز A‏ إحداث حقيقية موجبة (أي اختيار المفحوص الناجح) 
ویتضمن الربع الثاني المرمز له 8 احداث خاطنة موجبة (أي اختيار الفحوص الفاشل). 
ويتضمن الريع الرابع المرمز له 2 إحداث أحداث خاطئة سالبة (أي رفض الفحوص الناجع). 
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شكل )1-12( تمثيل بياني توضيحي بنقاط تعتمد على درجات الاختبار (X)‏ ودرجات المحك (۷). 
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عدد مات ادي نع J ga pak‏ )12 -1د)» » وهذه هي: 

=1/ النسية القاعدية: وهي نسبة الفحوصین الذین يمكن أن ینجحوا في الحك. وتحسب 
النسية من ابعلاقة: 
cdl‏ امد الرموز عدد التحوصین في الأرياح الأريعة. 8 


SS 


ice o‏ المفحوصين الذي سیختاروا للء الشواغر الوظيفية. ويحسيوا 
باستخدام العلاقة | 


B+A 
D+C+B+A 
عد‎ n 
ظ‎ + ۸ 

وقد طور US‏ من تایلور ور اشل )1939 (Taylor & Russel,‏ مجموعة جداول مكثفة 3 Jetis cad‏ 
الصدق ونسبة الاختيار التي تؤثر في نبسبة النجاح» وعلى القارئ ملاحظة أن الاختيات 
العشوائي المفحوصين من مجمو المتقدمين يؤدي إلى أن تكون نسبة النجاح مساوية للنسبة 
القاعدية, لهذا فان مقارنة نسبة النجاح الناتجة عن استخدام متنبيء معين بالنسية القاعدية 

تشیو إلى مدی تطور قرار الاختیار باستخدام لاشتبار ال لنوعية القرارات )تخد 

بالاختیار العشوائي للمفحوصین. ٠‏ ' 

ویبین الجدول(1-12) قسبة التجاح لعاملات ارتباط مختلقة بين الصدق التنبزي(زج0) 
ونسبة الاختیار. وقد حسبت نسب النجاح عند تجاح 50 % من الفحوصین من الجموع 
الکلی على الحك (علی سبیل الثال عندما تکون النسبة القاعدية 50 %( وبتفحص العمود 
عند Pyy‏ = صفرء نری أن نسبة النجاح 50 Fo‏ وعلی هذا فان استخدام الاختبار للاختیار 
ينتج die‏ نسية نجاح مايه للنسبة القاعديةء يمعنى أن استخدام اختبار له معامل 
ارتباط = Pxy‏ صفر لا يكون له أثر آکثر مما هو للاختيار العشوائي للمستخدمین. « ويفحصص 
العمود عند 0.2 = (Ogy)‏ نجد أنه عند نسنية اختیار 0.10 وتکون نسبة النجاح 0.64 . لاحظ 
أنه مع نسب الاختیار النخفضة )0.10( واختبار معامل صدقه منخقض (0.2 = (Pxy‏ يمكن 
أن ينتج Ge‏ نسبة نجاح اعلی من النسبة القاعدية الناتجة عن استراتيجية الاختیار 
العشوائي» كذلك إذا كانت نسبة الاختیار 0.70 فإن نسبة النجاح 0.54 لذلك فان اچبرنا على 
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اختيار نسبة اساسية من المتقدمين OB‏ نسبة النجاح لا يمكن أن تكون أكبر من النسبة 
القاعدية, ولا تظهر هذه الظاهرة فقط عندما يكون معامل الصدق منخفضاً « ولكن مع أختبارات 
= ال ی وبشکل ام ای إن كان Pay O80.‏ ونسبة ae aaa a‏ 
ai‏ اختیار ial Geena‏ ن duh‏ النجاح تهبط إلى 50 % on‏ فإنه لا ميزة لاختيار 
اختبار ذي صدق le‏ لهذا الموقفء GSF‏ تلخيص العلاقة بين هذه المفاهيم على النحر الآتي, 
وعلى أفتراض و النسية القاعدية ذد تبقی ثابتة لجموعة الفحوصس: 
-1- تكون نسبة النجاح عالية عندما يكون معامل الصدق عالياً ونسبة الاختيار منخفضة. 
-2- عند ازدیاد Gud‏ الاختیار ودون تغيير oles‏ الصدق فإن نسبة النجاح تقل. 
قات lak tau‏ وزيانة معامل الق فان as‏ التمام alae‏ 
للح ل کک ل 
ee‏ ا و ل a‏ وت 
صدق مختلفة ونسبة اختيار مختلفة لتحقيق نسبة النجاح نفسهاء على سبيل المثال: إذا زادت 
النسبة القاعدية فإننا نحتاج delal‏ صدق آقل للحصول على نسبة النجاح نفسها (وذلك عند 
نسية اختيار مخ بالمقابل fal‏ ا النسية القاعدية 0 يتغير صدق الاختبار فاته p‏ 
١‏ الجدول 12 ae‏ تسنب لمات لتجمعات مختلفة لمعاملات الصدق ونسب الاختيار عند 
teat‏ نجاح قامدية 050 . 













مقتيسر ( عن: 
H.C. Taylor and ۳ .T. Russell The relationship of validity coefficients to the practical effective-‏ 
“ness of tests in selection: Discussion and tables. Journal of Applied psychology, 23,565-578.‏ 
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ص BG‏ عتی_سنم> E‏ مزع نها لمعي OEE‏ مشا ce‏ 
اس ام en oN Lest‏ ال روہ و ele‏ ربكن الي فعا عدت 
عي فک 


الاختبارات أن يميزوا (حقيقة الحياة) احدى السيكومتريات التي يتبنوهاء وتحديداً فإنه 
لمجموعتين من المفحوصين وا قاعدية مختلفة تم اختيارهم بنسب الاختيار نفسها 
وياستخدام اختبار له معامل الصدق نفسه لكلا الجموعتین» كذلك فلمجموعتي مفحوصين 
وينسب قاعدية مختلفة ونريد تحقيق نسب النجاح نفسها لكليهماء فان هذا غير ممكن 
باستخدام اختبارات لها معاملات صدق ونسب اختيار متمائلةء ويعد تمييز هذه المباوئ 
متطلباً سابقاً لفهم أعمق للأدب النفسي التعلق بالتحيز الثقافي ونماذج الاختيار العادل. 








0 الرئيسية والمجموعات الفرعية: 

f‏ من الضروري تكوين معنى لمصطلحات المجموعات الرئيسية وی كما تستخدم في 
السياقات النفسية. R‏ آلجموعه الرتيسية إلى الجموعة التي تتضمن العدد الأكبر من | 
التقدمین إلى مركز استخدام أو مؤسسة تربوية معينةء شير الجموعة اد إلى Pape‏ 
التي تحوي آقل عدد من المرشحين من مجموع التقدمین, فعلی سبیل الثال GESTS‏ إلى 
التقدمین آلقبول في مدرسة التمریض فإننا نجد أن الاناث يمظن الجموعة الرئيسة, بینما 
یمثل الذکور المجموعة الثانوية, وإذا نظرنا إلى التقدمین إلى كلية الطب البيطري فإن الوقف 
ينعكس Sf‏ یمثل الذکور الجموعة الرئيسة وتمثل الاناث الجموعة الثانوية, وتتحدد الجموعات 
الرئيسية والثانوية بوساطة الخصائص الدیموغرافية التي تهم مستخم الاختبار [مثل 
العنصر أو العرقء الخلفية الثقافيةء العمرء العجز الطبيعيء Nee‏ 
”إن قضية عدالة الاختيار تظهر حتى عندما تكون المجموعة الرئيسة والثانوية متساوية في 
العدد. افترض أن جامعة تحوي العديد من كليات المجتمع وتسمح بتحويل التخصص في 
السنة الثالثة. وهنا تظهر قضية مهمة وهي العدالة في اختيار المجموعات التي تدرس في 
الجامعة في السنتين الأولى والثانية. ومجموعة الطلبة المحولين في السنة الثالثة حتى عندما 
تكون المجموعتان ممثلتين بالتساوي من مجموعة التقدمین» ففي مثل هذه الحالة ليس المهم 








و حال 
لتعريفه! لنفسي للتحير: 

أشار كليري )1968 (Cleary,‏ إلى أن الاختبار يكون متحيزاً لإحدى المجموعات الفرعية في 
المجتمع إذا ظهرت اخطاء غير صفرية في التنبق التعلق بالأعضاءء ويوضح الشكل )2-12( 
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أحد المواقف التي يمثلها كليري» ويكون خط الانحدار هنا للمجموعة الكلية أعلى من خط 
الانحدار للمجموعة الثانوية وادنی من خط انحدار المجموعة الرئيسية. 

وفي الثال يكون استخدام خط الانحدار للتنبق بالاداء غير متنيأ يه للمجموعة الرئيسية 
predicted)‏ «تنا)ويكون أكثر من متنباً به (Over predicted)‏ للمجموعة الثانويةء لهذا فان 
استخدام خط الانحدار للمجموعة LSI‏ يؤدي إلى تنبؤ متحيزء وفسر کل من دارلنفتون Dar-‏ 
lington, 1971)‏ وهنتر وشمبدت )1976 (Hunter & Schmidt,‏ ونين )1973 (Linn,‏ تعريف كليرى 
بأن الكككان لا نكي ا إذا كانت خطؤط انحدار المجموعة الرئيسة والمجموعة الثانوية 
هي نفسهاء فان كانت خطوط الانحدار هي نفسها لجموعة مفحوصين متجانسين على القنبی 
فإنه لا توجد فروق بين درجات الحك المتنبئ لكل من المجموعة الرئيسية والثانوية, لهذا فان 
تعريف كليري وكما فسره دارلنفتون والآخرون يتطلب تساوي قدرة الطلبة كما تقاس بالمتنبئ 
لن حصلوا علی درجة الحك نفسها للاختبار فين Synth‏ 

وعدل جنسن )1980 Jenssen,‏ تعریف الانحدار التساوي لتحيز الاختبار» وقد برهن على أن 
الاختبار لا يكون متهيزا اذا: 


Y (dati) 








درجة الاختبان X‏ 


شكل (2-12): 
خطوط الانحدار للمجموعات الرئيسية والثانوية التي توضح تعريف كليري لتحيز الاختبار 
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كانت خطوط الانحدار لدرجات المحك على درجات المتنبئ الحقيقية هي نفسها لكلا 
. الجموعتین و )2( كانت الأخطاء المعيارية لقيم المتنبئ (انظر قصل 11) هي نفسها لكلا 
الجموعتین. ويدعم الشرط الأول بحقيقة أن خطوط الاتحدار على الدرجات الملاحظة 
للمتنبئ تكون غير متساوية» ويبساطة يسبب أخطاء القياس حتى إن كانت خطوط 
انحدار درجات المتنبيء الحقيقية متساوية. والشرط الثاني يعني ببساطة أن المتنبئين 

_ درجة الدقة نفسها لكلا المجموعتين.‎ Log! 
تعریف کلیری على آن طريقة الاختیار تکون غیر متحيزة‎ (MicNemar, 1975) مکتدار‎ judy 
a هذه‎  تناکو‎ TN: Taa i إذا استخدمت خطوط انحدار متفصلة لكلا المجمو هتين‎ 
al jae مکی . لاحظ الانتقال في موقف مکنا“ من الاهتمام کاس الاهتماء الاختبار:‎ es ی‎ 
إلى طريقة اختیار غير متحيزة. وهذه الازاحة توضح كيفية تحول السوّال عن تحیز الاختبار‎ 
آلفحوص‎ Gi إلى سوال عن تحیز الاختیار. وعلی القارئ أن يميز أن تبني موقف مکنمار يعني‎ 
نی الدرجة الأعلى على التنبی يجب قبوله بخض النظر عن الجموعة التي ينتمي آلیها. لهذا‎ 
(Value-laden الذين تتنباً لهم بمقدرات آعلی» ومن الواضح أن هذا موقم ذو قيمة محمولة‎ 
عندما بختار الفحوص نو الدرجة‎ Yale وعلى سبیل المثال: يكون الاختيار‎ lll position) 
وعلى النقيض فإن مركز مكنمار لا يؤدي بالضرورة لاختيار المتقدمين ذوي‎ cle الأعلى لمركز‎ 

الترجات الى le‏ ال 
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شكل )3-12( خطوط الانحدار الثانوية والرئيسة مع الخط القانوي بعلو الخط الرئيسي 
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افترض على سبيل المثال في الشكل (3-12) كان توزيع درجات المحك نفسه للمجموعة 

| الرئيسة والمجموعة الثانوية» ولكن أداء المجموعة الرئيسية على التنبی كان أفضل من 

| المجموعة الثانوية. ففي هذه الحالة تكون درجة الفحوص على المتنبئ من المجموعة الثانوية أقل 

من درجة المفحوص من المجموعة الرئيسة. ولكن درجته على المحك أعلى لذا سيتم اختياره 
Ja‏ من مفحوض المجموعة الرئيسية. 


وقدم ۆرتدابك )1971 (Thorndike,‏ تعريفاً ثانياً للتحيز مؤكداً على أن الاختبار إذا كان لأي , 

wall, ما ا و احدة جلى‎ eee 
ين الرئيسية والثانوية نفسها على الحلخ وهآ يعني‎ ۱ 

أن الاختبار Jule‏ اساسا إذا كانت الجموعات الرئيسة والثانوية تبعد .عن التنبی: كما هو على 
الحك. ولتوضیح هذا التعریف بدرجة آکبر افترض أن الانحراف العياري على آلتنبی كان 
نفسه لکلا الجموعتین» وهذا ینطبق أيضاً على الحك وعندما یتوافق التنبی مع تعریف 
ثورندايك فان معامل ارتباط بوینت بایسیریال بين الجموعة الرئيسية أو الثانوية مع درجة 
المتقبئ ستساوي معامل ارتباط بونیت بایسیریال بين الجموعة ودرجة الحك. 
GLI,‏ دارلنفتون )1971 (Darlington,‏ تعریفین اضافیین للتحیز. ولکنه لم یفضل Lassa]‏ 
ole‏ اكمر احم الفرينن هو أن EEES‏ عفن تیور إذا كان توريع لهات علي" 
التنبی هو نفسه لكلا المجموعتينع : والتعریف الاخر» هو آن الاختبار یکون غض متحیز اذا كان 
اتهدار gol‏ عل اتيك هو نفسهآکلا لوعن BET UX,‏ سایقاء وعد pin cl AN‏ 
م بتعریف التحیز من خلال العلاقة بين التنبی 
dih‏ فضلاً عن التوجه إلى مشكلة التعریف من خلال العدالة في الاختیار» وتطویر طرائق 
لاستخدام هذه التعریغات» وسنراجع بعض هذه الجهود في الجزء الآتي. 
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طرائق الاختيار العادلة CAPO‏ ص . 
من المهم عند البحث عن أسئلة العدالة في الاختيار التمييز بين نوعين من القرارات: ' 
الفردية والمؤفسساتية ویظهر اتخان القر > ات الفردية عندما يكون الهدف الأساسي لغملية 
اتخاذ القرار هو الزيادة all‏ للمنقعة all‏ لت دون ينشىء sA‏ 
ft Sore‏ 
قائمة الميول المهنية وینصح الفحوص ree‏ سا دوه 5 الا snes Steal J‏ 
ميل المفحوص تستخدم هنا لاتخاذ قرار فزدي بالمقابل» فإن sie‏ قرار مؤسسى يظهر عندما 
الح تسم کک م م ر 
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تحقيق أهداف خاصة بالمئسسة (مثل اختیار 
المتقدمين الذين احتمال نجاحهم GSI‏ ودون الأخذ بعين الاعتبار الأفضل لأي من المتقدمين. 
النقطة الأولى التي سنكونها بالنماذج السيكومترية للعدالة ستأخذ بعين الاعتبار هوأر قرار 
الاختيار هو اتخاذ قرار مؤسسيء وعلى هذا فان طرائق عدالة الاختيار ستأخذ بعين الاعتبار 
آهداف aaah!‏ 

وقد تم اقتراح العديد من نماذج عدالة الاختيار في الأدب السيكومتري. وسیتم توضیح 
ستة نماذج في هذا الفصلء وهذه النماذج هي نموذج الانحدار. ونموذج المخاطرة المتساوية 
للمستخدمین» ونموذج دارلنفتون. ونموذج الاحتمالات التساوية» ونموذج النسب التساوية, 
ونموذج الاحتمالات الشرطية. وقد لا تکون التفاصیل التقنية من اهتمامات القاریز, وقد کتب 
عن هذه التفصیلات كول )1973 (Cole,‏ والذي یزودنا Lal‏ بمقارنة هذه النماذج بعضها ببعض 
من خلال درجة القطع على المتنبئ ونسبة المفحوصين المقبولين من المجموعة الثانوية 
وخصائص أخرى. 
تموذج الاتحدان AOL‏ 2 
= يعتمد نمؤذج الانمدار على افتراض أن الاختيار يكون عادلاً عندما يتم اختيار الذين 
درجاتهم على المحك أعلى بغض النظر عن الجموعة التي ينتمون إليهاء لهذا فعند قبول )100( 
طالب للدراسة في تخصص معين يكون محك الاختيار هو اختيار الذين حصلوا على أعلى 
)100( درجة على التنبي, GS‏ مذا يتم Hts‏ خطوط انحدار منفصلة لکلا الجمومت, 
ویتم الاختیار من التقدمین الذین حصلوا على أعلى درجات التنبیم» وح عندما تتطابق 
خطوط الانحدار للمجموككين كإن القصوصين الذين لهم الدرجة نفسها على المتنبئ ومن 
مجموعات مختلفة فإن التنبق يكون بدرجات مختلفة على المحك (انظر شكل )4-12( 
وكنتيجة فإن كان لمفحوصين اثنين الدرجة نفسها واحدهما في المجموعة الرئيسية والآخر في 
المجموعة الثانوية فإنه لا يتم اختيار ctl‏ لهذا فإن أي طريقة للاختيار غير هذه قد يكون لمن 
حصل على درجة أقل على المحك. 


-ولذلك. فللمؤسسة التي تهدف اختيار المتقدم المؤهل بدرحة أعلى من خلال الأداء على 
المحك بغض النظر عن المجموعة فإن هذه الطريقة تعد مناسبة كنموذج اختيار. 








Y (Criterion) 










Majority Group f 


Minority Group 2 









ام (ey È _¥ (Predictors‏ رہ tI AP‏ ع ماك و اکر رال معام 
ep Cty KYA =‏ ف سکیم مرا Lys (Gertie‏ 
OD es‏ ,چ ملعو Le Mb‏ کف عیرست رھت الا ع 1 
شكل )4-12( استخدام نموذج الانحدار لتحديد درجة قطع CE ASA SN co gan dl wal‏ 
Colley foe;‏ تهج 


= 1 2 ANG bed و سکول ق اد طسی‎ ٩ 
الیل ع ا ہو‎ ten te , 0 ee es Pie prea eae 


هذا السو أن يحدد تک بار تكتبار EAS‏ النكاح على es ai‏ 
ال ك ار ماعن ی eal‏ فون فده (a all‏ ویتم هد كملق خطوط اجار 
كلا المجموعتين ومن ثم حساب درجة التنبؤ على الحك (باستخدام معادلة التنبق المذكورة في 
الفصل الثاني) عند فشل الخاطرة. وفقط للمفحوصين الذين لهم فشل مخاطرة أقل من القيمة 
المحتملة هم الذين يتم اختيارهم, ویعتمد حساب احتمالية الفشل على افتراض التوزيع 
الطبيعي لدرجات الحك. وهو أنه عبر المفحوصين الذين لهم درجة معينة على ألتنبيء يفترض 
أن تتوزع درجاتهم توزيعاً طبيعياً على الحك» ويفترض أيضاً أن يكون تباينات التوزيع 
الاحتمالي الشرطي نفسه لدرجات المتنبئ جميعهاء ومع هذه الافتراضات فان احتمال الفشل 


oy. 
في التوزيع الطبيعي العياري» وفي هذه الصيغة‎ En =7 يكون في الساحة تحت‎ 
y 


تمثل yp‏ درجة النجاح على المحكء ١لا‏ هي الدرجة المتنبأة للمفحوص و Oxy‏ هي الانحراف 
العياري لدرجات المحك للمفحوصين جميعهم عند قيمة K‏ المعُطاة. وهذا الانحراف المعياري 
يساوي الخطأ العياري للتقدير» ويتم اختيار المتقدمين إذا كان احتمال فشلهم اقل من أقصى 
احتمالية للمخاطرة. لتوضيح ذلك: افترض أن درجة النجاح على المحك لفرد ما تقع عند 18ء 
فان اقصى مخاطرة - 0.35 والخطأ المعياري للتقدير للمجموعة الثانوية -8 وللمجموعة 
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کک =-05 واحتمالية الفشل للمجموعة الثانوية = 0.40 وللرئيسة = 031 


AE‏ هالوئيسيية-فقطدأن نموذج الخاطرة المتكافئة 
يعمل جیدا fal‏ كانت اا تهدف es‏ الاحتمالية لفشل المستخدمء وتهدف لهذا بغض 
النظر عن خليط الأعضاء الناتج (ومن الجدير بالذكر هنا أنه في حالة تساوي الأخطاء 
العيارية لكلا المجموعتين فإن نماذج الخاطرة المتكافتة والانحدار تؤدي إلى نتائج متشابهة, 

-* ويعد هذا النموذج قطعياً عندما تكون كلفة الاستخدام والتدريب Lol‏ اساسياً. 

5 تموذج دارلنغتون: سا عشت 
ا دارلنغتون )1971 (Darlington,‏ أن الطريقة المناسبة للاختيار العادل تكمن في تقرير کم 
هي القيمة لاختيار متقدم من المجموعة الثانويةء واستخدام هذه القيمة في اقتراح طريقة 
الاختیار» واقترح لتحديد هذه القيمة طرح السؤال "ما هو كم تناقضنٌ آلدرجات على آلحك بين 
اعضاء الجموعتین الرئيسية وألثانوية, وق اعتبار كل منهما مقبول وبالتساوي في عملية 
الاختيار ٠‏ فان كانت قيمة التناقض K‏ فإن طريقة دارلنفتون في الاختیار تضیف هذا القدار 
& لدرجة المحك المتنبا بها لأفراد المجموعة الثانوية جمیعهم» ویکون الأعضاء الختارین هم 
الذين لهم أعلى درجة على المحك بعد التعديل بإضافة k‏ لأعضاء المجموعة الثانوية وقد يكون 
تموذج مناسباً مؤسسة old‏ أولوية كبيرة فى اختيار المتقدمين من المجموعة الثانوية 
أكثر من اختيارها لن هم أكثر كفاءة أو ضبط احتمالية فشل المقبولين. 












نموذج الاحتمالية المتساوية: 

تتطلب الطرائق الثلاث السابقة تحديد خطوط انهدار منفصلة للمجموعات الرئيسية 
والثانوية ثم حساب درجات التنبؤ على المحك لكل متقدم باستخدام معامل انحدار مناسب لكل 
مجموعة, وتتطلب الطرائق الثلاث الآتية استخدام المفاهيم الصحيحة المىجبةء والخاطئة 
الوجبة. والصحيحة السالبة. والخاطئة السالبة وكما هو موضح في شكل )41-12( ويمكن 
فهم هذه الطرائق بشكل أفضل بافتراض أن مستخدم الاختبار ومن خلال عمليات التصديق 
السابقة حصل على خطوط بيانية تصف العلاقة بين درجة الاختبار والأداء على المحك لكلا 
المجموعتين الرئيسية والفرعية. وتفترض ايضاً أن مستخدم الاختبار حدد مستوی الحد 
الأدنى للقبول في الأداء على المحك والتي هي نفسها لكلا الجموعتین» وعلى مستخدم 
on‏ في هذه الطرائق أن يحدد درجة القطع على المتنبيء لكل مجموعة. وبالتالي فإن 
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الخطوط البيانية لکلا cade pan‏ تتقسم coll‏ آريعة آریاع (ربیهیات) Ally‏ تتطابق میم شروط 
الاختیار الموصوفة فى هذه النماذ ج. 
سے y‏ کي 
~ يعتّمد نموذج الاحتمالية المتساوية على أساس فلسفي يؤكد أنه لكل متقدم فرصة النجاح 
ينجح 9660 من المجموعة الثانوية على الحك. « ولتحقيق هذا فان درجة القطم على التنبی 
EE POT Goyer EE‏ ف نميا كلا الوكين تين» حيث أن A‏ هي الأحداث 
A+B‏ 
الصحيحة الموجية و 8 هي الاحداث bLA‏ الوجبة (انظر شكل 31-12( وکنتیجه» فان 
معالجة المتقدمين وبالدرجة نفسها على المتنبئ قد تتباين بالاعتماد “على المجموعة التي ينتمون 
النموذج من قبل لين )1973 Voi (Linn,‏ مع أنه لم يدافع عن استخدامه. وتکمن نقطة ضعف هذا 
النموذج فى استحالة تطبيقة عندما يكون الاختلاف متطرف بين المجموعتين على درجات 
المتنبئ )1980 (Jensen,‏ 
ctts‏ ب In‏ رصت عه ته نة مساوةه للها 
ا النسبية التاسته: نل الت سسا can 1 ١ Sa g‏ 
fal Yata‏ تحددت درجه 3 القطع على اللو i‏ الاختيار لكلا tage‏ = 
ا ا 


۱ 79 
الخانوية %50- والنسبة القاعدية للمجموعة الثانوية هى نفسها )%50 أيضا)ء وفی هذاشضه 





























النمودن تما lias‏ 20 من الجموعا الرکیسییمب ان تفتار 9:20 من Lescol‏ ام 


Re القاغزية للجم هة الرتفسية 0 والمجموعة الثانوية‎ tall وال آخر اترك ن‎ a atl 
a اللمجموعة الثانوية هي شلد‎ dct لذا فان ف‎ 0 


1352 بطي اكتنا وها م Ta aes‏ 
صویمکن تبيان أن متطلبات نموذج ثورندايك يمكن تحقیقها عندما تكون ATE hall‏ 
+ 


هى نفسها لکلا المجموعتين (وثانيةء يفضل عودة القارئ إلى الشكل )41-12( إذ أنه يوضح 
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هذه القيم لكل من A)‏ و8 Thy! (Dy Cy‏ السبب فإن نموذج ثورندايك يسمى نموذج النسبة 
الثابتة» وكما هو الحال مع النماذج الأخرى فان التطبيق يتطلب من مستخدم الاختبار تحديد 
درجات قطع مختلفة على الاختبار المتنبئ لجموعات الفحوصین الختلفة. ۱ 
۱ تیف 
نموذج الاحتمالية الشروط: 
عد | ee gag‏ 
Das‏ ویتطلب هذا التموذج احتمالية الاختیار نفسها لكل فرد یحتمل نجاحه بغض النظر عن 
الجموعة التي ینتسب إليهاء وحتی یتحقق هذاء قإن النسبة شب يجب أن تکون نفسها: 
5 + 1 

للمجموعات جمیعها (انظر شکل 1-12-د) , وثانيةء لتحقیق هذا الهدف يجب تحدید درجات 
قطم مختلفة للمجموعات الختلفة» وتعرف النسبة شب على Lai‏ احتمالية الاختیار 
الشروط بنجاح. وهذه تشیر إلى اسم النموذج. ویطلق على هذا النموذج أيضاً اسم نموذج 
الفرص المتكافئة. 
نقد النماذج: 

نقد بترسون ونوفيك )1976 (Peterson & Novick,‏ نماذج: النسبه الثايتة. والاحتمالية 
المتساوية والفرص المتكافئة من منطلقينء لتوضيح هذاء خذ على سبیل المثال نموذج ثورندايك 
الذي يتطلب أن تكون النسبة بين نسبة الاختيار إلى النسبة القاعدية ثابتة عير الجموعات» وقد 


٠‏ أثبت بترسون ونوفيك أن العدالة التى تتطلب نسبة ثابتة عبر الجموعات. ويالمنطق نفسه تتطلب 


العدالة أن تكون نسبة الرفض إلى نسبة فشل ثابتة عبر المجموعات (وهذا مكافئ GY‏ تكون 
نسبة الرفض لكلا المجموعتين مساوية لنسبة نسبة (Liah‏ ويطلق على طريقة الاختيار التي 
تعتمد على هذا النموذج نموذج النسبة الثابتة المماكس ووضح بترسون ونوفيك أن قرار 
مشابهة بالنسية لكل من نموذجى الاحتمالية المشروطة والاحتمالية التکافنة. 

وقد أشار كل من بترسون ونوفيك إلى أن كل فرد يجب أن يضع قرار شخصي حول فشل 
طريقة الاختيار في الاتفاق مع متطلبات نموذج تورندايك ونموذج النسبة الثابتة العاکس والتي 
تعد متناقضة Libis‏ وهذا يفتح الباب لاحياء وانتشار نموذج النسبة الثابتة كما هو لنماذج 
الاحتمالية المشروطة والاحتمالية التكافئة. كذلك فإن لدى بترسون ونوفيك نقداً أكثر لهذه 
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النماذج» وتحديداً فهي غير مكررة للقرار النظريء ویظهر أن هذا النقد تم الموافقة عليه بصورة 
واسعة فى أدبيات القياس» وفي الحقيقة فان سوير وكول وكول )1976 (Sawyer, Cole & Cole,‏ 
حاولوا ادخال القيم المتضمنة فى نموذجی النسبة الثابتة والاحتمالية المشروطة فى نموذج 
القرار النظري» وحیث أن کل من نموذجي الانحدار والمخاطرة المتكافئة تتطابق مع نظرية 
القرار فإن بترسون ونوفيك يؤيدون هذه النماذج بدرجة GST‏ ومع ذلك فقد آشاروا إلى أن کل 
من add‏ النماذج يمثل موقع لقيمة واحدق REY‏ مالا يمكن تطييقة دائماًء وستتوضح هذه 
النقطة أكثر بعد عرض نظرية القرارء أما بالنسبة لنموذج دارلنغتون فإنه لا يتساوى مع نظرية 
القرار تماما من وجهة نظر بترسون ونوفيك, مع أن هذا ممكناًء ومع ذلك فإنه يمثل واحدة فقط 
من نظام القيم العديدة الممكنة. 
Shee! CO fs‏ 

نظرية القرار كطريقة للاختيار: Da‏ 

يمكن استخدام طريقتين أساستين في التحليل في حالة تطبيق نظرية القرار في مشكلات 
الاختیار ولد لتسهيل aall‏ لتفسير ستعرض Mol‏ صيةغ الد لتحليل الوب سعة Yas‏ من صيغ الد لتحليل 
الطبيعي (التي تعتمد النحنی الطبيعي) المستخدمة في أدبيات القياس (Gross & Su,‏ 
Peterson, 1976)‏ , 1975والخطوات الأساسية فى الصيغة الموسعة للتحليل المستخدمة فى 
نظرية القرار تكون على النحو الآتي: 

2- يجب أن يؤشر صانع القرار أوزاناً للقيم النسبية (والتي تسمى المستخدمية (Utility‏ 

لكل نتيجة ممكنة (نجاح و فشل) لقرار الاختیار. 

3- حساب المستخدمية المتوقعة لكل قرار نسبي - القبول أو الرفض -. 

4- مقارنة قيم المستخدمية المتوقعة الأكبر على Yat‏ القرار الناسب. 

وسيفسر الجزء الآتي الطرائق والحسابات الستخدمة في الإجراءات التبعة في الخطوات 
الأريعة السابقة. 


تحديد الاحتماليات والمستخدميات: 


Les‏ نركز على الاختيار من مجموعة واحدة» افترض أن توزيع SUS‏ المتغير لدرجات 
التنبی والمحك للمفحوصين جميعها معروفة من deal ys‏ سابقة (دراسة الصدق)» وأن درجة 
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Copy C Al Set al ayl 
wt LE و التے‎ JAN اعت .هته معسام ا ھتہ و نائ‎ 
1 مس حبر ار هد الك اعم نمم مع الهم | تاه‎ a 
eee نت و جافل‎ Lise Da صی موه 3 سات ي‎ 

التوريع lt‏ التغیر معروف فان توزیع درجات dat‏ ممكنة للمتقدم الذي له درج معينة علی 
التنبی» وكنتيجة فان احتمالية النجاح أو الفشل للمفحوص تصبح Lag yao‏ دع P/X‏ و Q/X‏ 
تمثلان احتمالیات النجاح والفشل لدرجة معينة على التنبی (انظر شکل 5-12). الکمية PX‏ 
هي الساحة فوق رل في التوزيع احادي التغیر فوق × و qx‏ هي الساحة تحت 2ل في التوزیع 


Criterion 








Predictor 


شكل )5-12( توضيح للاحتمالات المشروطة للنجاح (/0) وللفشل.(×/ي) 

تذکر آن شالك حوادث اريعة لقرار الاختیان نیح موجب. خاطی موجپ. خاظئ ساي 
افترض أنه یمکن ترتیب الاحداث الاريعة من خلال هذه القیم لصانم القرار على سبیل الثال 
القرارات الصحیح الوجب والصحیخ السالب Las‏ احداث ناتجة عن قرارات صائبة, 
وبالتالی فإنها تکون لها آهمية متساوية كذلك فان القرارات الخاطئة الموجبة, والخاطثة السالبة 
کلاهما احداث ناتجة عن قرارات غير صائبة وبالتالي فإنها ذات فائدة آقل من تلك القرارات 
الصائبة, واعتماداً على وجهة نظر صانم القرار فان هنالك فائدة أقل للقرارات غير الصائبة 
اکثر مما هي للقرارات الاخری. ولتوضیح هذا Les‏ نفترض أن الحدث الخاطئ السالب هو 
الأقل فائدة» وعلی الدی البعید فان الاحدات المكنة يتم ترتیبها حسب قيمتهاء افترض الآن أن 
صانع القرار كان بإمكانة تحديد tas‏ عددية للاحداث الأريعة تشیر إلى مرغوپیتها النسبة: 

1.00 = ppp 

1.00 = uiu 

0.25 = Ufu 

وهل = 0.75 


تسمی هده القيم العددية مستخدميات: ويشير الحرف الأدنى إلى صحيحة موجية, 























صحيحة سالية, خاطئة سالبة خاطئة موجبة على التوالی. وعند هذه النقطة فلن نتشعب ليحث 
الطرائق المتبعة للحصول على هذه القيم الشار إليهاء ولكن يمكن للقارئ المهتم الرجوع إلى 
(Novick & Lindsey, 1978)‏ 
حساب المستخدمية المتوقعة: 

كما هو في نظرية القرارء فان القرار النسبي عن المفحوص (Sar‏ معرفته بحساب متوسط 
أو (المتوقع) الستخدمية لكل قرار بديل ممكنء واختيار البديل ذى القيمة المتوقعة الأكبر ولي 
الصحيح الوجب هي Pix‏ وهي احتمالية النجاح عند درجة المفحوص X‏ وبالطريقة نفسها فان 
احتمالية ihat‏ الوجب هی Q/x‏ وهي احتمالية الفشل dic‏ درجة معينة ox‏ وتحسب 
المستخدمية المتوقعة للقرار المختار ب: 

(VA PA eee rane fp (q/x) + Hep (p/x) = E (u), 
E DA Werner ae Utm (Q/X) + gy (p/x) = E (2), 

وقد يندهش القارئ GY‏ الاحتمالية المحسوية من كلا المعادلتين هی نفسهاء افترض أن p/X‏ 
تمثل احتمالية النجاح لدرجة معنية x‏ ولاختيار قرار فإن الفحوص الناجح عبارة عن حدث 
صحيح موجبء وعلى هذا فإن احتمالية الصح الموجبة تكون Phi‏ وم تضرب ب Pl‏ 

والقرار بالرفض للمفحوص الناجح عبارة عن حدث خاطيء سالبء وعلى هذا فان 
احتماليةء الخطأً السالب هي Ph‏ و ول تضرب ب phy‏ عند حساب E(u),‏ 

ولتوضيح dia‏ افترض كما هو سابقاً أن 1 = Min‏ = ولا 2025 مهب 0.75 = روناء 
وافترض أنه لمفحوص ماء كانت 0.4 = Ph‏ و 0.6 = 9/۶ لذلك فان: 

E(u), 21 0.4 + 075 x 0.6 0.85‏ 
E(u), = 0.25 x0.4 + 1 x 0.6 = 0‏ 
وحیث آن الستخدمية التوقعة لاختیار القرار تتجاوز الستخدمية التوقعة لرفضه فانه 
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doles‏ والقرار المختار مفضل GY‏ مستخدمية الحدث الخاطئ الموجب ثلاثة اضعاف 
مستخدمية الحدث الخاطئ السالب. 


تطبيق نظرية القرار في الاختيار بين مجموعتين 

تیمها تشخ SI‏ و و عملية الاختيار فان احتماليات نجاح المفحوصين على 
المتنبئ نفسه تكون مختلفة اعتماداً على المجموعة التي ينتمون إليهاء وعلاوة على ذلك فإن 
صانع القرار يأمل بتأشير قيم مستخدمية مختلفة للنتائج USAT‏ التنوعة للاختيار من 
مجموعات المتقدمين الختلفة, وسنوضح الآن كيف يمكن تطبيق صيغ التحليل الشاملة لاختيار 








القرار باستخدام مجموعتين مختلفتين من المتقدمين. عندما يكون لدينا مجموعة واحدة؛ فان 


هنالك أريعة أحداث ممكنةء ومع مجموعتين يوجد ثمانية احتمالات ممكنة: صحيحة موجبة 
للمجموعة الرئيسية. صحيحة موجبة للمجموعة الثانوية... وهكذاء وكنتيجة توجد مستخدمية 
لثمانية احداث ممكنة؛ مثلاً افترض أن المستخدمية للمجموعة الرئيسية هي زوین لو Urn‏ = 
umg 0.25‏ = 0.5 › وافترض as‏ أن المستخدمية للمجموعة الثانوية هي 2مم = 1.25و 
O25 = thd‏ ريك 0.5 وجتضفن هذه الستخنمیات قبول مقحوص الجموهد gati‏ الذي 
سینجح والذي تکون له قيمة آکبر من تلك لقبول مفحوص في الجموعة الرئيسية (وتتضمن 
as‏ أن قبول المفحوص الناجح أكثر قيمة من رفض المفحوص الذي سیفشل في الجموعة 
الثانوية). 

افترض وجود مفحوصين اثنتين تين على المتنبئ نفسه أحدهما في المجموعة الرئيسية والأخر 
في المجموعة الثانوية» وافترض أن احتمالية النجاح لمفحوص المجموعة الرئيسية هی Pily‏ 
= 0.55: واحتمالية الفشل qy/y‏ = 0.45 ولفحوص المجموعة الثانوية فان الاحتماليات المماظة 
هي Pal‏ = 0.52 و qa/x‏ -0.48 وعلی هذا فإن احتمالية النجاح تکون أكبر المفحوص فى 
الضبوعة edad‏ ون ق ات كديس لذ ١‏ 

۳۶51 +ل/01)‎ U tpt (P1/x) = E (sı 

(0.45)0.25 + (0.55) 1 = 


.0.6625 = 

Uni (Qrt Umi (Pih) = E Oy 
)0.45(1 + (0.55) 0.5 = 

.0.725 = 











ومما سبق فإن مفحوص المجموعة الرئيسية سيرفض لأن قرار الرفض له قيمة مستخدمية 
أكير. 

وللمفحوص في المجموعة الثانوية تكون قيمة المستخدمية: 

Usp (da/x)+ Utp2 (P2/x) = E 2و(0)‎ 

(0.48)0.25 + (0.52) 1.25 = 





O77 = 

Uty2 (Go/x)+ Une (P2/x) = E U2 و‎ 

(0.48) 1 + )0.52( 0.5 = 

.0.74 = 
لته‎ Gad الصا‎ Cente cena 

كانت المناقشة السابقة لنظرية القرار مدخلاً لاستخدامها في مشكلات الاختيار ولفهم 
کامل وأفضل لستخدمیها الجدد فإنه يتطلب منهم معرفة مفاهيم إضافية Bac‏ والتي ستقدم 
فى هذا الفصل. 

وكما أشرنا سابقاً فإن ما يطلق عليه صيغ التحليل الطبيعية أكثر شيوعاً من صيغ التحليل 
الوسع فى ادب القیاس, وفي طريقة صيغة التخليل الوسع يتم حساب الستخدمية والرفض 
التوقم لقرارات الاختیار للمتقدم» ویکون القرار لاکبر Lard‏ ممكنة للمستخدمية التوقعة 
للمستخدمية المتوقعة, وعندما Sua‏ درجة القطع يمكن SLA‏ قرار بخصوص التقدم وذلك 
السستخدمية التوقعة الخاصة ك متقدم. 
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ولإجراء تحليل الصيغة الطبيعية دعنا نركز ثانية على الاختيار من مجموعة واحدة, 
وسنفترض ثانية توزيع ثنائي المتغير لدرجات المتنبئ والحك والمعروفة من أبحاث سابقة 


وكذلك حددت days‏ النجاح على الحك, وللأهداف المتصورة افترض أن معرفتنا عن التوزيع 


تعمثل في خط بياني مثل ذلك في شكل (1-12ب) (وفي البحوث النظرية مثل تلك الممظة 
بابحات غروس وسو )1975 (Gross & Su,‏ يفترض أن يكون التوزيع الثنائي الطبيعي؛ ولا يركز 
التحليل على مجموعة بيانات معينة ولكن على التوزيع الفترض). وعند تحديد درجة القطع 
على المتنبئ فإن التمثيل البياني يصبح كما في شكل (1-12د)» ويمكن تحديد احتمالية 
الاحداث الأريعةء الصحيحة الوجبة, والخاطئة الوجبة, والصحيحة السالبةء والخاطكة 
السالية: لاحظ أن هذه الاحتمالات تحسي لمجموعة المفحوصين الكلية مقابل حساب هذه 
الاحتمالات لكل مفحوص في صيغ التحليل الوسعة. ويرمز لاحتمالات الحوادث الأربعة ب: 

Pen, Pen , Pip Pips‏ وبالتالي تکون الستخدمية المتوقعة لدرجة قطع معينة والتي تعتمد 
على الاحتمالية هي: 

(4-12)... a... Hen و‎ + UinPin + UfpPfp + و ی‎ = E (U) 

لاحظ أن الستخدمية المتوقعة هى الجمع الوزون لستخدمية الاحداث الأريعةء والأوزان هي 
امتمالات هذه Sul yall‏ لاحظ of Ladd‏ الفرق gu‏ العادلة 12 = 4 والعابلة 12 - 2 اي 12 - 3 
أن الأولى كانت للمفحوصین جمیعهم في حين أن الأخيرة هي لتقدم (مفحوص) معین. 

Lauds LS,‏ فى-اشتقاق المعادلة (4-12) فإن المستخدمية التوقعة تحسب لدرجة قطع 
معينة, وهدف صيغ التحليل الطبيعي هي تحديد درجة القطع التي تعطي أقصى قيمة 
الستخدسية ا ولاهداف مفاهيمية قد تفکر بان هذه العملية هي تفسها في حساپ 
E (u)‏ لأي درجة قطع ممكنة, ومن ثم اختيار درجة القطع التي تعطي اکبر قيمة E (WA‏ , 
وعملياً فمن الضروري وجود صيغة لتحديد درجة القطع والتي تعطي أكبر قيمة ل E(u)‏ إن 
تحليل الصيغ الطبيعي يمكن استخدامه مع درجات قطع منفصلة لكلا المجموعتين الرئيسية 
والثانوية والتى تعطى أقصى قيمة للمستخدمية التوقعة. وتذكر أن هنالك ثمانية احداث 
وتؤدي صيغ التحليل الطبيعي إلى أقصى مستخدمية متوقعة عبر الاحداث الثمانية جمیعها. 


والتعبير الذي يجب أن يُعطي أكبر قيمة هو: 
۲ 7 2 
fni Peni +H fp, Pepi + Utpi Popi) Pi < = E(u)‏ دا + (Mai Ptni‏ ی 


والمصطلقة الوحيد الجديد هو زط( = 2.1( ويمثل نسب الطلبة في المجموعات الرئيسية 











والثانوية على التوالي» وتكبير هذا التعبير یکافی تعديل درجتي القطع واحدة للمجموعة 
الرئيسية وأخرى للمجموعة الثانوية. ويستمر هذا حتى نصل إلى أقصى قيمة للمستخدمية 
التوقعة, وللتفاصيل يمكن الرجوع إلى )1975 (Cross & Su,‏ وذلك في حالة افتراض التوزيع 
الطبيعي لمتغير ثنائي (توزيع الحك والمتنبئ). وبيّن بترسون (ط1976 Peterson,‏ أن الطريقة التي 
طورها كل من غروس وسو يمكن استخدامها كمبدأ مع توزيعات أخرى. 

محدد آخر للتغطية في هذا الفصل هي مناقشة ما يسمى دالة عينة المستخدمية ففى دالة 
Gard tall‏ كرن مستخدمية آي من الاحداث المقیقیة الوجبة مثلاً مسفظة عن درجات Bot)‏ 
الفعلية التي حصل علیها الفخوص أو بکلسات آخری, فعند نجاح مفحوصين اثنين فان 
مستخدمية قرار الاختیار تکون هي نفسها بقض النظر عن أي فرق بين درجات الحك 
للمفحوصينء ویبدو أن هذا منطقياً في العدید من الواقف. أن مستخدمية تاجر أدت جهوده 
إلى ربح 2 ملیون دولار بالتاکید آکبر من مستخدمية تاجر آخر أدت جهوده إلى ربخ 50.000 
دولار (وللمهتم بحساب آثر استدلال عتبة الستخدمية انظر 1981 (Schmidt & Hunter,‏ 


لهذا فإن دوال الستخدمية غير دالة لعتبة الستخدمية والتي تؤخذ بعين الاعتبار في 
مشکلات الاختیار. وأخيراً كما تم ملاحظته مسبقاً فان قضية اعطاء قيم عددية للمستخدمية 
لم تتم عنونتهاء وكل من مجموعة المستخدمية ودوال المستخدمية كم بحثها قي )& Noviek‏ 
Lindly, 1978)‏ والذي قدم عرضاً لعدد كبير من المراجع في هذا الموضوع. 
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مج عم ۱۳۳۳۳79۹2 











التمارين: 


1 اختير عشوائياً (10) من الذکور و )10( من الاناث من مجموعة كبيرة من الطلبة 
للاشتراك في برنامج تدريبي في العلوم في المدرسة الثانوية. وفي بداية البرنامج الذي 
استمر لسنة طبق على الطلبة اختبار تحصيلي في العلوم ودونت درجات الطلبة في 
الاختبار ومتوسطهم في البرنامج والاحصائيات الوصفية لهؤلاء الطلبة. 








المتوسط 77 2.40 74 2.50 
الانحراف المعياري ‏ 13 083 10 039 
الارتباط 0.87 0.78 


لاختيار الطلبة في البرنامج مستقبلاًء shag‏ النجاح في البرنامج على آنه متوسط نقاط 
0 باستخدام البيانات الملائمة. حدد ما إذا كانت طريقة الاختيار هذه عادلة Lads‏ 
للنماذج الآتية: 
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1 الخال alas‏ 
2~ النسیة الثايتة 
ENS‏ 
casei -4‏ الاتحدار 


ب) افترض أن برنامج l‏ السنة ية ت نكيف ر30 من سوه ما رجا الفط 
المشروطة. 

ج) ما درجة قطع المتنبئ التي يجب أنشاءها لكل من الذكور والإناث فيما لو استخدم 

تموذج الانحدار ودون أي حد لعدد الطلبة الذين سيقبلوا في البرنامج. 

د) على وفق تعريف ثورندايك للاختبار غير التحیز هل يعد اختبار العلوم التحصيلي 


اختبارعادل؟ 
والفرعية. 





فان كانت درجة النجاح على الحك 60 ویرغب العهد في الوافقة على المتقدمين الذین 
وی على ار %75 الماح علي الاك ما درجات القطع التي يجب وضعها للمچموعات 


3 افترض أن الستخدمية للمتقدمین في الجموعات الرئيسية والفرعية على النحو الاتي: 

















- فما القرارات التي يجب عملها للمتقدمين في كلا المجموعتين على درجة هذا المتنبئ؟ 
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الفصل الثالث عشر 
التحلیل العاملي 


عند تطبیق اختبارات عدة على مجموعة الفحوصین نفسها > فان ual‏ مظاهر التصدیق قد 
يستخدم تحديد ما إذا كان هنالك واحداً أو أكثر من تجمع للاختبارات بودي المفحوصين من 
خلالها lal‏ متشأيه E‏ . ويتحدد علد وتركيب التجمعات بالارتياطات بسن أزواج الاختيارات 
جميعها. على سبیل hart‏ کانت بطارية اختيارات الذاكرة تتألف من عدة cal lial‏ تحوى 
مثيرات ذات معنى في الفقرات واختبارات أخرى لا تحويهاء فقد يكون من المثير رؤية ما إذا 
كر ا الاختبارات دنم فرهبية أن هنالك تجمعين محظفين لاختيارات 
امناسبة للتحقق من هذه الأسئلة هى التحليل ey‏ 
يهدف هنا الفصل إلى تزویدنا بمقدمة شاملة لعملية التحليل العاملي» كما تطبق في دراسة 
الصدق الاكتشافى لبطارية اختبارات أو بعض المجموعات الأخرى من القياسات. اولاً سنقدم 
مثال مع بيانات افتراضية وتفتنیر المفاهيم الأساسية للتحليل العاملي ضمن السياق والعرض 
المقدم يساعد القارئ في الإجابة عن الأسئلة الآتية : 
1 كيف يشير نمطا ao‏ عبر التغیرات في مصفوفة الارتباطات إلى عدد العوامل 
2 ماذا “Gal gall aor‏ 
3/ كيف تستخدم تشبعات العوامل فى تحديد عدد العوامل (أى تجمعات الارتباطات) في 
مصفوفة الارتباط الملاحظة؟ 
4 ما هی الدورات؟ 
5 كيف یعرف الباحث أي مجموعة من تشبعات العوامل (الناتجة عن الدورات المختلفة ) 
لتفسیرها ؟ 











وسنعرض في النصف الأخير من هذا الفصل مثال كامل التحليل العاملي لدرجات اختبارات 


مثال مع بيانات افتراضية: 


افترض توافر درجات مجتمع مفحوصين على الاختبارات الفرعية لاختبار وكسلر 
للمراهقین, والمؤلف من sal‏ عشر اختباراً فرعياً. 

ستة منها لفظية وخمسة آدائية. وعلى أساس تصنيف مجموعات الاختبارات الفرعية فقد 
يفترض احدنا إن الارتباطات عبرها تقترح تجمعين للاختبارات الفرعية.ويمكن |ثبات هذا 
بالارتباطات الافتراضية عبر الاختبارات الفرعية البينة في جدول (1-13). وهنا كل زوج من 
الاختبارات اللفظية تظهر ارتباط داخلي أساسيء وكذلك كل زوج من الاختبارات الأدائية. ومع 
ذلك فان الارتباط بين أي زوج من الاختبارات الأدائية - اللفظية فقط 15 Oy‏ وفي لغة التحليل 
العاملي فان الاختبارات الفرعية تقيس عاملین, ففي مجموعة الاختبارات اللفظية تقيس عامل 
واحد. وفي الجموعة الادائية تقیس lal LUG (36 Gale‏ کانت الارتباطات gy‏ الاختبارات 
جمیعا = 0.6 مثلاًء فان هذه الارتباطات تشیر إلى تجمع واحد للاختبارات, أي إن الاختبارات 
تقیس عامل واحد. 
العامل وتشبعات العوامل ٠. a‏ 

CLEP CE oS T‏ سم 

العامل هو متغير غير ملاحظ آو كامن مثل الدرجة الحقيقية غير الملاحظةء وكما يمكن 
حساب معامل الارتباط بين الدرجة الملاحظة والدرجة الحقيقية فمن الممكن حساب معامل 
الارتباط بين الاختبارات والعوامل . ويبين جدول (2-13) الارتباطات بين اختبارات وکسلر 
الفرعية والعوامل المشار إليها في جدول (1-13) . 
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: جدول (1-13) : حسابات افتراضية عبر اختبارات وكسار الفرعية‎ i 
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ونيا ر LES‏ 

ویطلق على هذه الارتباطات اسم تشبعات العوامل, فكل ارتباط لفظي فرعي پرتبط مع 
abel‏ الأول Oo‏ 08 ومع العامل SU‏ 0:1: فف مع اناد يعن الاعتبار إن eA GRY‏ 
التي ترتبط مع العامل الأول هي الاختبارات اللفظية cof)‏ العامل اللفظي) والتي ترتبط مع 
العامل الثاني هي الاختبارات الادائية cof)‏ العامل الأدائي) والارتباط بين زوج من الاختبارات 
له علاقة Lage‏ بتشبعات الاختبارین على العوامل. وعندما یکون هنالك عاملين اثنين فان العلاقة 
تون 

(G-13) ss... Ain aja 1 2: = ززم‎ 

ویمثل: py‏ الارتباط بین الاختبارین 1 و a gd‏ تشبعات الاختبارین jy i‏ بالعامل الاول و 
ay ap‏ تشبعات الاختبارین ‏ و ز بالعامل الثاني. کتوضیح. افقرض إن الارتباط بن اختباري 
ارات والويوة ماه درم 01102 olen day‏ السرايل ay)‏ و 0ج ررم ك1 زا و 
ajz « 0.1‏ = 0.7 بالتعويض في العادلة )1-13( يؤدي الى: 

0.15 =(0.7) 0.1 + )0.1( 0.5 = 7 

والمعادلة العامة التی تريط الارتباطات الداخلية بتشیعات العوامل هی: 


11 


(@2-13)........... Aik Aik < =Pij 
٠” إلى عدد العوامل.‎ m حيث ترمز‎ 
الدوران:‎ 
بمتابعة مثال اختبارات وكسلر الأحد عشر الفرعية افترض مجموعة تشبعات عوامل جديدة‎ 
وكما هو مبين في جدول (3-13) مع إن هذه المجموعة مختلفة تماماً عن المجموعة المبينة في‎ 
جدول )2-13( وكلا المجموعتين تحقق المعادلة )1-13( فمثلاً ترميز تشبعات العوامل في‎ 
مد فان الارتباط بين اختباري المعلومات والرموز‎ añ مره‎ 851 i (3-13) جدول‎ 


العددية هو : 
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ی PE‏ لي کچ و ی کد 








جدول (3-13): تشيعات العوامل الدديلة لاختيارات وكسلر الفرعدة 





a72 a71 aiz aii 7 
0.15 = (0.2424- ( 0.4949 + (0.5656) 0.6363 = 


ويما أن تشبعات العوامل في کا )2-13( و )3-13( تحقق المعادلة )1-13( 
فمن غير الممكن الاختيار بين المجموعتين على أسساس ارتباطات الاختبارات الفرعية. 
وفي الحقيقة هنالك عدد لا نهائي من مجموعات تشبعات العوامل تحقق جميعها العادلة (13- 
1 وأي واحدة من هذه المجموعات يمكن الحصول عليها من مجموعة ثانية خلال عملية 
تسمى الدوران وجاء هذا المصطلح من التفسير الهندسي للتحليل العاملي (وسنقدم توضيحاً 
هندسياً للدوران لاحقاً في هذا الفصل). 
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وللمثال الافتراضي سنقدم فوراً توضيح هندسي الذي سيكون مريكاً نوعاً ماء لأن Sol gall‏ 
الفرعية الستة الأولى» وجميعها له تشبع العامل الثاني نفسهء وجميعها له تشبع العامل الثاني 
نفسه» لذا فإنه في أي عرض هندسي من غير الممكن التمييز عبر العوامل الستة الأولی أو عبر 
الخمسة الاخيرة. وترتبط LAU obit yall‏ بتحویلات رياضية» على سبیل الخال ترتبط 
تشبعات العامل في جدول )2-13( وجدول )3-13( كما يأتي: 

VERE DEEM و0707‎ + 0.707 aj; = ره‎ 
(ea 3-13( as 0.707 + 0.707 aj; = ap 


للتوضيح» افترض إن اختبار الرموز العددية الفرعي له تشبع عاملره = 0.1, 
و2 = 0.7 . ويالتعويض فى المعاملات 13-13 و 3-13 ب نحصل على : 
an‏ = 0.707 )0.1( + 0.707 )0.7( = 0.5656 


رو = 0.707 )0.1( - 0.707 )0.7( = 0.4242 


اه اتل GAN HEN Me‏ سوال میامن اققا الل الأهرى کیش 
مهمة فى الحقيقة. والنقطة الفتاحية هن أنه عند الحصول علی مجموعتین مختلفتین من 
قات الول gill Tika‏ ان کک ی كل دوي من التق اه ع ااه سكين Segal‏ 
التي تعزى إلى الارتباطات بالتساوي» وحجم تشبعات العوامل هو الذي يتغير فقط. كذلك على 
lal‏ ا بلاحط أن فنالك مجموعة مفطنة من العوامل الى تمن إلى كل رة من 
التشيعات ومع إن اورا و اال Gh‏ لفقي انك عير Ae A‏ ما يقتي الي اج 
درجات الاختبار ريدن انها مرتبطة ا 

وحقيقة of‏ الجموعات TAN‏ من تشبعات العوامل تحقق العادلة )2-13( اصفوفة 
الارتباطات نفسها لا تکون مشکلة فیما آذا کانت مجموعأت التشیعات لها تفسیرات متشابهةم 
ولسوء Ball‏ فإن هذا لیس صحيحاً على وجه العموم. فمثلاً مجموعتي تشبعات العوامل في 
E E (23 E‏ یی رات متا اما قاس ن نی 
وکسلر تقترح تشبعات جدول ( 2-13( عامل لفظي وآخر آدائي. ویفحص التشبعات في 
جنول O15)‏ هرق إن الاختبار اا ا a‏ موم راساسي على lal‏ ن 
ميقتو هذ الط إن العامل الأول عماجل عام بخاین chu‏ رکش (gsc cts AN‏ 
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وبالعودة إلى العامل الثاني سنری أن الاختبارات اللفظية لها تشبعات موجبة, في حين إن 
الاختبارات الأدائية لها تشبعات سالبة. وحيث إن كلا الاختبارات الفرعية اللفظية والادائية 
ليست مرتبطة سلبياً فان نمط التشبعات على العامل الثاني يقترح إن هذا العامل يهتم. 
بالاختلافات في 5 ات المقاسة بالاختبارات اللفظية والأدائية 

)2-13( نرمز لها ب بدا والعوامل sh‏ في حي إن ات لتشبعات في جدول ( 13- 6 فوم 





(fp + fı) 0.707 = fz 0.707 + fi 0.707 = f“ 


3 
(fy - f2) 0.707 = f) 0.707 +f 0.707 =f") 


لذا فان ۴ العامل المناظر للعمود الأول للتشبعات فى جدول )3-13( هو بالأساس 
مجموع العامكين وگو و المناظرة للتشيعات قي جدول )2-13( (ویخدم العده 0.707 ببساطة 
لیجعل ۳ لها تباین =1( وکنتيجة فانها تجعل التشبعات في العمود الأول تقترح عامل ple‏ 
وبعدها فان كان fi‏ يمثل العامل اللفظي و fz‏ يمثل العامل الأدائي ور 1۳ = ۴2+۴1(.707) يمثل 
العامل العام الذي تقاس JS‏ اختبار فرعي في WAD‏ بصورة مشابهة fy"‏ هو العامل 
المناظر للتشبعات في العمود 2 في جدول )3-13( وهو بالأساس الفرق بين العاملین الناظرین 
للتشبعات في جدول )2-13( وثانية تجعل من البديهي إن التشبعات في العمود 2 في جدول 
)3-13( تقترح أن العامل 2 يتعلق بالفروقات في القدرة القاسة بالاختبارات الفرعية اللفظية 
والادائية. ۱ 

واذا کان هنالك عدد لا تهات من مجموعات تشبعات العوامل القي تحقق العادلة )2-13( 
أ اا سس Peewee even E‏ رام ayy‏ وها Wer‏ 
اتفسیرها؟ کمبد! الجموعة الاکثر ملائمة هي التي تقایل بصورة افضل محك البتاء البسیط 
الذي طوره ثیرستون عام 1947ء ویشیر هذا الحك إلى إن کل اختبار له تشبعات كبيرة لاقل 
عد ی BAA sila yall‏ ای مان etal‏ زانلا تفیش وقد تنح مويك 
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(mulaik, 1972)‏ وصف اکشر اکتمالاً للبناء البسیط لذا فان متمك البناء البسیط یفضل 
التشبعات في جدول )2-13( على تلك في جدول (3-13). 

وعند إجراء التحلیل العاملي فإن الجموعة الأولی من تشبعات العامل يتم الحصول علیها 
باستخدام طريقة تسمع بالحساب الناسب لهذه التشبعات. . وهذه التشبعات تسمی 
الابتدائية of‏ غبر الدورة ,وعادة لا یجاول الباحث تفسیر التشیعات غیر الدورة والطراتق 
جمیعها ينتج عنها مجموعة من معاملات التحویل مثل تلك التي في العادلة (3-13) وتستخدم 
هذه العادلات لتحویل تشنبعات العامل الايتدائي وبالتالي تودي لتقریب البناء البسیط وبعدها 
بكم تفسیز العشنیعات امدور 5. وهنالك توعان من الدوران: غير الباشر (Oblique)‏ والستقل 
(orthogonal)‏ وکما تشیر الأسماء فإن الدوران الستقل يژدي إلى عوامل غير مرتبطة, في 
حين إن الدوران غير الباشر يوّدي إلى عوامل مرتبطة والتي ستناقش في الجزء التالي. وتجد 
المناقشة المفصلة لطرق الدوران موجودة في هارمون )1967 (harmon‏ وموليك )1972 (muliak,‏ 
والطريقة الاکثر شيوعاً للدوران المستقل هي طريقة تعظيم التباين )1958 , .varimax (Kaiser‏ 
وطور (pit ism‏ وسامبسون )1966 (jennrich & Sampson,‏ طريقة diol‏ الرباعية وهي الأكثر 
شيوعاً للدوران غير المباشر 
العوامل المرتبطة 

العوامل عبارة عن متغيرات غير ملاحظة لكنها مثل أية متغيرات أخرى قد تكون مرتبطة, 
وهی إن بعض الدوران لتشبعات العامل ينتج عنها عوامل مرتبطة, والبعض الآخر ينتج عنه 
عوامل غير مرتبطة. وقسمی مجموعة تشبعات العامل المناظرة للعوامل غير المرتبطة حلول 
مائلة أو غير مباشرة. والجموعة الناظرة للعوامل المرتبطة تسمى الحل المستقل gh‏ العمودي. 
ويقدم جدول )4-13( حل غير مباشر لاختبارات وکسلر الفرعية. والعوامل الناظرة لهذه 
التشیعات لها ارتباط = 0.13 تقر 

وفي الحلول غير الباشرة لا تون تشبعات العامل ارتباطات بين الاختبارات والعوامل بل 
تکون مكافئة لأوزان الانحدار. لنری ماذا يعني هذاء افترض إن اختبار الاستیعاب القرائي له 
تشبع = 0.81 على العامل الأول وصفر على العامل التاني. 
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re‏ یبن 








جدول )4-13( تشبعات العامل لاختبارات وکسلر الفرعية - الحل غير المباشر 1 





ویشیر التشبم صقر إلى انه بعد إن تؤخذ العلاقة الاحصائية بين الاستیعاب والعامل 
الأول فان الاستیعاب غير مرتبط بالعامل الثاني. وباسلوب آخر تقول إن الارتباط بين الفهم 
والعامل الثاني بتثبيت العامل الأول = صفرء ویشیر التشبع 0.81 إلى إن الفهم والعامل الأول 
بینهم علاقة حتی عند تثبيت العامل الثاني ويجب ملاحظة إن تشبع العامل في الدوران غير 
المباشر لا یکافی الارتباط الجزئيء بل یکافی معامل الانحدار العياري. 

ویکون الارتباط بين الاختبارين للعوامل الرتبطة دالة لتشبغ العامل والارتب اطات بين 
العوامل ویعبر عن العلاقة لارتباط عاملین على النحو الآتي: 

(14-3)... 0 2:1 ant 4 8:2 ayy + 22 aj + ayy 211 = Pij 
حيث ترمز 0 إلى الارتباط بين العاملين » وصيغة ممائلة لهذه تكون للعوامل الأكثر من‎ 





عدد العوامل: 
يعد تحديد عدد العوامل خطوة مهمة في التحليل العاملي » وقد يكون عدد العوامل اللازم 
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لتفسير تجمعات القياس لاي رقم بين 1 و ۰-1 حيث N‏ هی عدد القياسات . وكميداً يمكن 
تحديد عدد العوامل من علاقة الارتباطات بين أزواج الاختبارات الى تشبعات الاختبارات بهذه 
العوامل. فعلى سبيل JAN‏ إن كان هنالك عاملين يقاسان بالاختبارات فمن المکن تحديد 
تشبعات كل اختبار بالعاملین, وبالتالي فان العادلة (2-13) تكون كافية للغرض . ويحقق 
لارتباط بین الاختبارین 4 و ز وتشبعاتها بهنین العاملین stall‏ 
ززم = ajo aint ayy ay‏ 

وان كان هنالك عوامل عددها m‏ فان ا yi‏ وتات Gy LSS‏ بالعوامل ini:‏ 

تحقق العادلة: 


m 
ajk Aik  =Pij 


لتقديم مثال محسوس افترض مصفوفة الارتباطات الداخلية المبينة فى جدول (5-13) 
لاختبارات افتراضية أربعةء فما عدد العوامل اللازم لتحقيق العادلة )2-13( لهذه المصفوفة ؟ 
EA E ae a ae‏ وروة = 0.6 as‏ دايص ايام 

aj} 8:1 < Aaj 

کنثال: ل ورم =0.56, رره 08 . ريه - 07 

ونحصل علی: 

0.56 = (0.7) 0.8 = Go; 81 = 02 
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- لذلك فإن الارتباطات في جدول )5-13( تشير إلى عامل واحد يقاس بالاختبارات الأربعة 
حيث إن المعادلة (2-13) يمكن تحقيقها بالتشبعات على عامل واحد. افترض ol‏ 2014 0.8 لا 
4 كما فى جدول )5-13( قفى هذه الخالة نحتاج لأكثر من عامل لتحقيق المعادلة )2-13( 
بالتشبعات الأريعة المبينة سابقاً وتتحقق العادلة للارتباطات جميعها ما عدا الارتباط الجديد 
4 ولهذا الارتباط فإن: 

مرمع 0.80 = aj,‏ رية = 0:8 )0.5( 

لذلك فلو كانت بر- 0.8 بدلاً من 0.4 فإن عامل واحد لا يفسرالارتباطات عبر المتغيرات 
Saag‏ 

ومن المهم ادراك ان المعادلات المعروضة تريط بين معاملات الارتباط بتشبعات العوامل من 
خلال بارامترات المجتمع. فالمعادلة )2-13( تتحقق مثلاً عندما يكون عدد العوامل أقل من 
(1-N)‏ فيما لو عرفنا dag‏ الارتباطات في المجتمع. وللارتباطات المحسوية من Dall‏ تتحقق 
المعادلة )2-13( بالضبط عندما يكون ase‏ العوامل = (1-N)‏ فقط . فهل هذا يعني ان BAG‏ 
عوامل عددها يساوي (N-1)‏ في تفسير الارتباطات بين الاختبارات ؟ معظم علماء القياس 
النفسي لا يأخذون هذه الملاحظة بعين الاعتبارء بل انهم يبرهنون فشل ارتباطات العينة في 
تحقيق العادلة )2-13( لعوامل Lasse‏ أقل من (1-) والذي يعكس خط المعاينة في ارتباطات 
العينة . ولبيانات العينة فإنه يمكن التفكير بهذه المشكلة على أنها مشكلة تحديد عدد العوامل 
اللازم لتحقيق المعادلة )2-13( غلى وجه التقريب. ودرجة عدم تحقيقها للمعادلة يكون قلیلا 
بحيث يمكن أن يعزى إلى خطأ المعاينة 
نموذج التحليل العاملي: 

تعبر المعادلات (2-13) و (4-13) وتعميماتها عن الارتباط بين الاختبارات على آنها دالة 
لتشبعات العامل, وفى حالة العوامل المرتبطة تعبر عن ارتباطات العوامل. ويمكن اشتقاق هذه 
المعادلات من تموذج التحليل العاملي: 


m 


ke Se‏ ا E nae.‏ و 


~ 1-3 
حیث شكل Zp‏ الدرجة الرائية علی الاختبار i‏ 
و aik‏ تشيعات الاختیار 1 على العامل k‏ 
fka‏ الدرجة على العامل المشترك K‏ 
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و ؤها الدرجات على العامل الخاص باختبار 1 


ولغاية الآن لم نعرض التمییز بين الحوامل الشتركة والعوامل الخاصة. وقد أشرنا في 
السایق إلى العوامل المشتركة ببساطة باسم عوامل. والعامل الشترك هو العامل الذي يساهم 
بالارتباط اللاحظ بين اختبارین أو أكثر من هذه الاختبارات» والعامل الخاص هو العامل الذي 
پرتبط باختبار واحد فقط. ویضم هذا التعریف إلى الافتراض الذي ينص على إن العامل 
الخاص غير مرتبط بالعوامل المشتركة جميعاء Gly‏ العوامل الخاصة للاختبارات الختلفة غير 
مرتبطة ببعضها البعض, فهذا يؤشر إلى إن العوامل الخاصة لا تسهم في الارتباط بين 
الاختيارات. l‏ 


Communality and uniqueness الطائفية والتفردية:‎ 


سؤال مهم في التحليل العاملي يطرح حول الجزء من تباين الاختبار الذي يرتبط بالتباين 
m‏ 


CAL) Seen ak K€ =h} 
1-1 
للعوامل غير المرتبطة. وللاختبار الفرعي في المعلومات فإن الطائفية تكون:‎ 
(713) dae 0.65 =2(0.1)+2(0.8) = خط‎ 
والطائفية هي عدد أقل من )1( عندما تستخدم الدرجات الزائية في التعبير عن درجة‎ 
الاختبار في التحليل العاملي.‎ 
كذلك فان تباين الدرجات الزائية = 1. والطائفية هي الجزء من تباين درجة الاختبار الرتبط‎ 
بالتباين على العوامل المشتركة. والصيغة الطائفية لعاملين طائفيين مرتبطين تكون:‎ 
(8-13).......... ®. aj] مره‎ + arin + 221 = h2; 
من اختبارين.‎ SST وصيغة مشابهة تستخدم في حالة‎ 
وتسمى النسبة من تباين الاختبارات المرتبطة بالتباين على العامل الأول الخصوصية أو‎ 
التباین الخصوصي» ولحتسب د‎ 
(9-13) موه‎ h2; -l = už 
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وللاختبار الفرعي في العلوسات. فان :2 دا = 0.35 .ونظرياً يمكن تجزئة التباين 
الخصوصى إلى عنصرين هما: التباين الخاص و تباين الخطأ. فالتباين الخاص هو الجزء 
من تباين درجة الاختبار الحقيقية غير المرتبط بتباين الدرجات الحقيقية في أي من الاختبارات 
الأخرى. دعنا نرمز إلى التباين الخاص بالاختبار في بالرمز :52 ولتباين الخطاً بالرمن e2‏ . 
فان التباين الكلي يساوي: 

0.1 =e} + 82; + h2; 

وتباين الثبات للاختبار هى ,52 + 1ء إذ إن مجموعها يقع بين صفر وواحد » ويمكن 
التفكير به على انه نسبة » لذا فإن :52 + :82 هي النسبة من التباين الكلي الثابتة أو المكافئة 
لثبات درجات الاختبار. وكنتيجة يمكن اعتبار :82 على أنها الحد الادني لثبات درجات 
الاختبار 1. l‏ 


مثال بياناته حقيقية 

يوضح المثال الآتي تطبيق التحليل العاملي لدراسة استكشافية لصدق البناء 50 فرعية 
منفصلة لاختبار ذكاء واسع الانتشار. وقد دون كل من جيورتن وبايلي (Guertin & Bailey‏ 
(1970مصفوفة ارتباطات المقاييس الفرعية الأحد عشر لقیاس وكسلر للبالغين (wais)‏ وتصف 
البيانات المستخدمة في حساب الارتباطات على أداء (200) فرد من رجال الأمن والاطفاء التي 
جمعها ما ترازو وزملاءه «(Matarazzo,1964)‏ واصفر حجم للعينة في التحليل العاملي elas‏ 
على النتائج ج التجريبية هو التطبيق على (100) مفحوص أو بواقع عشرة آضعاف duc‏ 
التغیرات. وحجم العينة في JEL‏ يتجاوز القيمة المقترحة على أساس التجرية العملية. وییین 
جدول )6-13( مصفوفة الازتياطات لهذه. 

sal,‏ من القرارات المهمة في أي عملية تحليل عاملي هو عدد العوامل المشار إليها فى 
مصفوفة الارتياطات ويوجد عدد من المحكات لتحديد عدد العوامل. الأول هو عدد 8 
التشبعات التي اكير من1 في مصفوفة الارتباطات» وفي الفقرة التالية نطرح مثالين لتفسير 
الأساس في اختيار محك قيم التشیعات الأكبر من 1. وقدم موليك )1972 , (Mulaik‏ التعريف 
الرياضي للتشبعات والأساس المنطقي الرياضي لمحك قيمة Lad‏ تشبع اكير من 1 لعدة العوامل. 

ولاختيارات عددها OLN‏ مصفوفة الارتباطات لها تشبعات عوامل عددها N‏ ومع أن 











طريقة الحصول على قيم التشبعات غير مبينة هناء فمن الهم ملاحظة أن قيمها النسبية تعتمد 
على مقدان الارتباطات ونمطهاء لذا فمن المنطقي أن قيم التشبعات يشير إلى عدد العواملء 
فمثلاً إذا كانت الارتباطات بين ghol‏ اختبارات وكسلر الفرعية = 0.7 وقيم التشبعات المتبقية 
= 03 ۰ فمن البديهي القول بان القاییس الفرعية جمیعها تقیس عامل واحد. وان كان الارتباط 
بين الاختبارات اللفظية 7 وبين القاییس الادائية 0.7 والارتباط التقطع = صفرء فمن البديهي 
القول إن القاییس الفرعية تقیس عاملین ولصفوفة الارتباطات هذه فقد تکون قیم آحد 
التشبعات 52 والاخری 43 والتسعة التبقية = 0.7 فهذا يشير إلى الحاجة لعاملین لتفسیر 
الارتباطات. ويبين جدول ( 6-13( قیم التشبعات لارتباطات مقیاس وكسلر أن هنالك قيمتين 
للتشبعات اکبر من 1ء مما يؤدي إلى اقتراح وجود عاملین, ومع أن هنالك قيمتين للتشبعات 
هی an‏ قاس عا مله ؛ لذا فان نتائج التحليل العاملي تفترض وجود 
gele‏ أو ثلاثة أو آريعة سیتم تدوینها. 


caus‏ جدول )7-13( الحل الابتدائي أو غير الدور لعاملين لارتباطات مقياس وکسار. 
على تشبعات العامل القابلة للتفسير. وفي الشكل (1-13) تم رسم التشبعات على العامل 
الابتدائي الأول على الحور الأفقي والتشبعات على العامل الابتدائي الثاني على المحور 
العمودي. مثال: لتحديد موقع اختبار الفهم الفرعي على الرسم البياني نجد أن احداثياتها 
تساوي (0.63,-0.34) لاحظ ان الرسم البياني يقترح تجمعين للمتفیرات, يتكون التجمع الأول 
الثاني من بقية القاییس من T‏ 11( وهذه تقع في الريع الأعلى إلى 0 اشر د 
القاییس . لاحظ Last‏ ان الحور الافقي يمن بالمركز مقسماً القاییس الفرعية الى مجموعتین . 
وكنتيجة فإن القاییس الفرعية في كلا الجموعتین لها تشبعات اساسية على العامل الأول 
ومبينة على الحور الافقي. 


== 5 
































جدول )6-13( : جدول الارتباطات عبر اختبارات وکسلر الفرعية : 








تشیعات مصفوفة الارتباطات هي: 3.79 , ۰127 0.98 ۰0.92 ۰0:76 071 , 0.64 


. 0.35 0.40 , 0.55 8 
W.HG-uer tin, and JD Bailey, بان نشر عن:‎ 


Jr (1970) interoduction to modern factor analysis, Ann arbor, Michi Edward , Brothers. 


جدول )7-13( : التحليل العاملي الابتدائي لبيانات اختبار وكسلر 
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پا سل لسساستا 
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شكل )2-13( : تمثيل بياني للدوران المستقل لبيانات اختبار وکسلر 
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ویسمح دوران العوامل بايجاد محورين جديدين: احدهما يمر بدرجة اقرب الى المجموعة 
الاولى والاخر يمر بدرجة اقرب الى المجموعة الثانيةء وللحل غيز المباشر فإن المحورين 
الجديدين يكونان متعامدين . ويبين الشكل (2-13) حل غير مباشر للمحورين الاصليين » 
ویوضح الخط النقط عملية ايجاد تشبعات الاختبارات الفرعية على محوري الدوران وذلك 
للاختبار الخامس. وكانت التشبعات المدورة على الاختبار الخامس تساوي 0.39 على العامل 
الدور الأول و 0.19 على العامل المدور SLL‏ ويما أن التدوير غير مباشر لذا فان الحاور 
تبقى متعامدة . وفي مثالنا يمكن ان يعبر كل محور عن مجموعة الاختبارات الفرعية الخاصة 
به . وبالمقابل فإن تحريك sal‏ المحورين بحيث یصبح اكثر قرباً من مجموعته فإن المحور 
الاخر سيبتعد عن مجموعته» أما في الدوران الستقل يكون المحورين غير متعامدين لذا فإنه 
يمكن تعيين المحورين الجديدين بحيث يصبح كل منهما اكثر قرباً من مجموعته. 

ويبين الجدول )8-13( تشبعات العوامل للدوران المستقل للعاملين» وللمقارنة فإنه يبين 
ايضاً التحليل العاملي المدور غير المباشر لكلا العاملين. وقد استخدم الاسلوب الرباعي 
الباشر للحصول على الدوران الستقل, واستخدم اسلوب تعظيم التباين للحصول على 
الدوران غير المباشر . وكان الارتباط بين العاملين للتدوير المستقل )0.55( . وعلى القارئ ان 
يضع نصب عينيه أن التشبعات الأقل من (0.3) تعد غير مهمةء ويشير الجدول الى ان 
الملتغيرات 2.1 : 4:3 ؛ 65 تتشبع بصورة اساسية بالعامل الأول . ويجب تذكر أن 
استخدام الدوران المستقل يجعل تشبعات العوامل مماثلة لعاملات الانحدار . لذا فإن 
التشبعات المنخفضة على العامل الثاني تعني انه عند الأخذ بعين الاعتبار العلاقة بين العامل 
الاول والمتغيرات (6.5.4.3.2.1) Ob‏ لا توجد علاقة مع العامل الثاني أو انها تكون ضعيفة . 
ويشير الجدول )8-13( كذلك الى ان المتغيرات (من 8 إلى11) MERER NOR D EEA‏ 
وتشبع المتغير الثالث متساو لكلا العاملين» وتشبع العامل الرابع مهمل لكلا العاملين . 











جدول (8-13) : مجموعتي حل التحليل العاملي الثنائي المستقل وغير المباشر لبيانات اختبار وكسلر 





وكما هو ملاحظ فان جدول )8-13( يبين أن تشبعات العامل الناتج عن الدوران غير 
المباشر باسلوب تعظيم التباين والنمط العام للتشبعات (لكلا التدويرين غير الباشر والمستقل) 
متشابهة. الا ان تشبعات المتغيرين الثاني والرابع على العامل الثاني كانت اكثر اهمية في 
التدوير غير الباشر عنه في التدویر للستقل وبصورة مشابهة : فإن التغیرین (8 و 10) لها 
تشبعات اساسية اكثر على العامل الاول في الحل غير الباشر » لذا فان الحل الستقل يبسط 
النمط الذي يعد دليلاً على عدم التحيز في الحل غير المباشر. وهذه مقارنة غير متحيزة بين 
الحلين المستقل وغير الباشر في التحليل العاملي. 

ويتضمن الجدول (9-13) تشبعات العامل التي تم الحصول عليها من عملية التدوير 
الرباعي المباشر لثلاثة عوامل. العامل الاول يشبه كثيراً العامل الأول فى الحل المستقل 
للعاملین. وتقترح التشبعات على العاملين الاخرين تجزئة العامل الثاني في جدول (8-13) الى 
عاملين . وتشبع العامل الثاني في جدول )9-13( بالمتغيرين )9 و11) بشكل اساسي. في 
حين تشبع العامل الثالث بالمتغيرات (7, 8 , 10) بشكل اساسي . ويقترح تفحص مصفوفة 
الارتباطات bow‏ للتشبع بالعاملين الثاني والثالت. فالارتباط بين المتغيرين )9 15 1= 0.60( 


9 سا , 









































وهو اكير ارتباط فى المصفوفة: كذلك فإن الارتباط بين التغیرین (8 و 10 =0.36( والتغیر 10 
لا يوجد له ارتباط اخر عال كهذاء في حين أن التغیر 8 له ارتباطین اخرین عالیین: الاول مع 
التغیر9 والثاني مع التغیر11. ویبین الجدول )10-13( الحل للعوامل الاربعة الناتجة عن 
الدوران الستقل» وبصورة اساسية فان التشبعات على العوامل BI‏ الاولی مشابهة لما في 
جدول (9-13). والفرق الرتیسی في تشبعات التفیرین الخامس والثاني على العامل الأول إذ 
انخفضت عند الانتقال من الحل بثلاثة عوامل الى اربعة عوامل. وعلی العامل الرایع نری ان 
تشبع التغیر الخامس )0.7(« وتشبع المتغير الثاني )0.28( في حين ان جمیع التشبعات 
الاخری مهملة. ومن فحص مصفوفة الارتباطات یتبین ان التغیرین الخامس والثاني ارتباطهما 
)= 0.38(« وهو الارتباط الاعلی للمتغیر الخامس وهذا هو سبب ظهور العامل الرایع. 


جدول )9-13( حل Jol gall‏ الثلاثة الستقل لبیانات اختباروکسلر 





وسیرکز تفسیر التحلیل العاملي على الحل باربعة عوامل. العامل الأول مشبع بصورة 
اساسية بالعلومات فالقیاس الفرعي (العلومات) هو اختبارفي العرفة يحاول تجنب العرفة 
واختبار التشابهات یختبر القدرة على تحدید الطريقة التي یتشابه فیها شيئين COPS)‏ ویتطلب 
الاختبار اللفظي LS)‏ هو مبين من اسمه) من الفحوصین بیان معان الکلمات . والی حد معين 
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فان فقرات الاختبارات الفرعية الاريعة يمكن الاجابة علیها بناءاً غلى العرفة الكنسية: اي انها 
لا تتطلب بالضرورة آية قدرة استدلالية. مع أن هذا لیس صحیماً بعض الشيء لاختباري 
الفهم والخشابهات, على سبیل الثال من المكن في اختبار التشابهات ان الفحوص تلم GS‏ 
یتشابه الشیئین في الفقرة » لذا فإنه سیجیب على الفقرة على اساس العرفة المكتسبةء كذلك 
فقد لا يكون الفحوص تعلم طبيعة التشابه في فقرة اخری» ویمکن ان يصل الى الجواب عن 
طریق الاستدلال اللفظی . لذا يبدو أن العامل الاول یعکس العرفة اللفظية والاستدلال اللفظی. 
والعامل الثاني مشبع بصورة اساسية بالاختبارات الفرعیة: توضع تصمیم الکعبات وتجميع 


جدول )10-13( حل العوامل الاريعة الستقل لبیانات مقیاس وکسلر 








الاشیاء. ففي الاول یستخدم الفحوص مکعبات old‏ جهات لونها pool‏ واخری لونها ابیض 
انش التي :تزاف كبو ما 


ويبدى ان العامل الثاني يعكس القدرة على عمل شيء كلي من اجزائه المؤلفة له. ففي تصميم 
الاشياء يجمع المفحوص الاشياء التي تؤلف شيء ما كما هى في الطبيعة ومحاولة تخيل الكل 
من اجزاژه. واقترحت انستازي (Anastasi,1968)‏ أن هذا العامل يتكون من الجمع بين 
سرعة الادراك والتخيل المكاني وهذه العوامل تكون منفصلة في دراسات اخرى . 
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العامل القالث مشبع بصورة أساسية باکمال الصور وترتيب الصور ولدی أقل بالرموز 
العدديةء ففي اختبار تكملة الصور يطلب من المفحوص نکر الاشياء الناقصة في الصورة , 
ويتطلب ترتيب الصور من الفحوص وضع سلسلة صور في ترتيب يتحدث عن قصة . وكلا 
الاختبارين يتطلب علاقة الجزء بالكل , ففي ترتيب الصور على الفحوص ان يحدد مفاهيمياً 
ماذا يحدث في كل صورة ثم يميز أو يكتشف العلاقة التي تربط الصور معاً وفي تكملة 
الصور على المفحوص ان يميز الصورة الكلية ثم يكتشف الجزء المفقود . كذلك تستخدم 
اختبارات تجميع الاشياء وتصميم المكعبات علاقة الجزء بالكل ايضاء ومن الممكن ان 
الاختبارات الفرعية الاربعة تتطلب قدرات متشابهة فاختبارات الاشياء تتطلب قدرات لا تتطلبها 
اختبارات الصور والعکس صحیح . 
العامل الرایع مشبع بصورة اساسية بسلاسل الاعداد التي تتطلب من الفحوص ان یتطم 
قائمة اعداد ثم يعيد القائمة باتجاه امامي او عكسي ویبدو أن هذا عامل ذاكرة غير مستخدم 
باختبار اخر عدا الفهم. 
ان اختیار حل العوامل الاريعة يفسر على انه قرار بيداغوجي» وعملياً فان العدید من 
مستخدمي التحلیل العاملي لا یختارون هذا Gall‏ لان العامل الرابع یتحدد بدرحة كبيرة 
بمتغير واحد. فسلاسل الاعداد والتشبع باختبار الفهم. من الصعب تفسیره. علاوة على ان 
. تفسیر العامل الاول للمعلومات والاستدلال اللفظي یجعل من البداهة تشبع اختبار الفهم ظاهر 
في العامل الاول» إذ ان هذا یظهر في حلول كلا من العاملین والثلاثة. ویجد العدید من جماعة 
التحليل العاملي ان اي منهما (العاملین أو الثلاثة) مفضلاً على العوامل الأربعة. وفي 
الاختیار بين العاملین والثلاثة عوامل پبدو أن محك الادراك يبدو Lage‏ وتذکر انه بالانتقال من 
العاملین إلى الثلائة فان العامل الثاني (أي الادائي) ots‏ الى عاملین جدیدین, فالعامل 
الثاني الجدید مشبع بصورة اساسية بتصميم الکعبات وتجمیع الاشیاء. والعامل الثالث 
مشبع بصورة اساسية بتكملة الصورة وترتیب الصور. ویبدو أن هذا منطقياً إذ یقترح أن 
اختبارات الاداء التي تستخدم العالجة تتطلب قدرات مختلفة عن تلك التي تستخدم فحص 
yeaa‏ با اة إلى ام الإتراك وم التركيب الط که مومة اا فى اسار 
عدد العوامل التي تفسر, مع ذلك لم يحدث هذا في بيانات بعض مجموعات المثال الحاليء اذ 
ان محك التركيب البسيط كان تحقيقه واضحاً جداً في عدد من العوامل. ومع عدد أقل من 
العوامل» فان العوامل فإن التركيب البسيط لم يتحقق حتى على وجه التقريب ولعدد أكبر من 
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العوامل لم تكن مدركة أو انها كانت محددة بعدد قليل جداً من المتغيرات. واخيراً فان المحك 
الق لعيد من ااسوامل الفسؤة هر An AKG‏ هدما فلك اكرات ها في دراه 
عديدة: فان العوامل التي تتکرر في الدراسات هي التي یجب أن تفسر. ١‏ 
بالاضافة انى التحقق من تف يعات العامل قٍنه يحي التحقق من الطائفية للاختبار 
ومقارنتها بثباته. وهدف هذا التحقق والفارنة هو تحديد: 
1 نسبة تباین الاختبار الرتبط بتباین العامل الشترك كما يؤشر اليه من خلال الطائفية 
للاختبار, 
2 نسبة تباین الاختبار الثابت ولکنه مرتبط بالعامل الخاص بالاختبار» وتحسب هذه 
النسبة من الفرق بين ثبات الاختبار وطائفية الاختبار. 


والتوضیح افترض أن الاختبار الفرمي (الاستیعاب) في حالة العوامل الثلائة على انها 
الحل كان له تشبع 0.55 على العامل الأول والذي یقترح انه يقيس المعرفة اللفظية 
والاستدلال. من جهة اخری الطائفية له تساوي (0.34), وهذه تشیر الى ان الاستیعاب 
يشارك ب%34 من التباین مع العوامل الطائفية الثلاثة. وقد دون وکسلر (Wechsler,‏ 
(Latins 1658)‏ ارتباط تهر سبیرسان -براون المع ك تن الفهم الفا OFT‏ هذه 
EI E ELT N A PEE 300 oa E a el‏ 
(وتكرت ها HY‏ توشبيحية فقط): واستكداء مكل الت اة هافن اله 33 
( = 0.77[100 - 10.34) من التباين في درجات الاستيعاب ثابت ومرتبط بالعامل الخاص 
لاختبار الفهم. ومن الواضح بعد ذلك ان تشبع 0.55 على العامل الأول يعد من الخطأ اعتبار 
اختبار الفهم قیاس Jalal‏ العرفة اللفظية والاستدلال بصورة اساسا من جهة آخریء فان 
تشبع تجمیم الاشیاء على العامل الثاني=0.82 ۰ وطائفية = 0.65 , لذا فانه یشارك ب %65 
من تباینه مع العوامل الطائفية الثلاثةء وب 961 من تباینه ثابت ومرتبط بالعامل الخاص 
بتجمیع الاشیاه. Le iS,‏ فان تجمیع الاشیاء بصورة اساسیة any‏ مقیاس للعامل الثاني. 
ومثال ثالث. تشبع الاختبار اللفظی على العامل الاول 0.82 وطائفية -0.60, لذا فانه یشارك 
ب %60 من تباینه مع العوامل الثلاثة. وله LS‏ = 0.95 لذا فإن 35 من تباینه ثابت 
و العام انخاسن اغ :لفك فاه قى وهر اة اتعامل SAS‏ وتان 
Lag‏ بالعامل غير الرتبط بالتفیرات الاخرى التي تقيس المعرفة والاستدلال اللفظيين . 

ونقطة Lage‏ متعلقة بالتطليل العاملی هو انه ببساطة بحدد تجمعات التغیرات» ومحاولات 
تعدو ناذا كولم هته لمات ی و EEN RL gee eg‏ هداع ان 
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المزيد من الاثبات. ايضاً وبالاضافة الى ما كتب عن التحليل العاملى هناء على القارئ ادراك 
ان المفحوصين في مثالنا هم رجال الامن والاطفاء, وهؤلاء لا يمثلون فئة البالغين بشكل عام . 
ولهذا السبب فان نتائج التحليل العاملي هنا قد تختلف بصورة جوهرية عن نتائج انماط 
اخری من المفحوصين. 
التحلیل العاملي الاستكشافي والتوکيدي: 

یمکن وصف الباحثين الستخدمین للتحليل العاملي على متصل استكشافي - توكيدي. 
فالتحلیل العاملي یکون استکشافياً مخضا فیما لو pl‏ يكن لدی الفاحص فرضية ویکتنفه 
الغموض حول sse‏ او طبيعة العوامل القاسة بالاختبار ویکون التحلیل العاملي توكيدي اذا 
كان لدى الفاحص فرضية ویجری اختبارات احصائية لها وسیتم تقدیم ملخص لطبيعة هذه 
الاختبارات لاحقا في هذا الجزء. 

والقلیل من الباحثین استکشافین بصورة محضاء فمن الالو ان یکون لدی الباحث 
نظرية عن عدد العوامل القاسة بالاختبارات وطبیعتها. فمثلا في مثالنا لمقياس وکسلر للبالغين 
فقد یفترض الباحث وجود عامل لفظي واخر ادائي» ومن الصحیح ایضا ان هذه الفرضية لم 
تخضع لاختبارات احصائية في التحلیل العاملي النموذجي. فضلا عن ان هذه العوامل تم 
استخلاصها وتدویرها. وخضعت لبعض الاحکام الشخصية التعلقة بمدی مطابقة النتائج 
اقرش ts ll‏ وهذا الفشل‌فی اختتار Gad gh‏ یجفل Cash AN‏ استکشنافية ASt‏ مدااهی 
TILL‏ توكيدية. وسیتم توضیع مشكلة الاسلوب الاستكشافي فى هذا من خلال التحلیل 
العاملي لبيانات وکسلر .فقد یفسر بعض الباحثين الحل من خلال العاملین الاثنين والذي يوفر 
قياس يدعم فرضية العاملین اللفظي والادائي. وقد يفسر اخرون بالاعتماد على الحل من 
خلال العوامل الثلاثة والذي پوفر دعم اقل لفرضية العاملین اللفظي والادائي. وفي التحلیل 
العاملي التوكيدي فان الباحث يضع فرضية حول القیم العددية لبعض العالم (تشبعات 
العامل» والارتباطات بين العوامل, kN,‏ وال وه هو ان یشیم البا یه وه 
ان تشبعات عامل معین -صفرء على سبیل المثال فللباحث الذي یتوقع عامل لفظي واخر 
ادائي لبیانات وکسار عليه ان يضع فرضية ان الاختبارات الادائية جمیعها لها تشبعات = 
صفر على العامل الأول وان الاختبارات اللفظية جمیعها لهاتشبعات تساوي صفر على 
العامل الثاني . 1 

cuss‏ الجدول )11-13( هذه الفرضية تشبعات الاختبارت الادائية الفرعية جمیعها علی 
العامل الأول تساوي صفرء في حين ان تشبعات الاختبارات اللفظية الفرعية جمیعها على 
العامل الثاني تساوي صفرء ولم تبین الفرضية القیم العددية لكل تشبع ومرمز لها بالرمز K‏ 
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laa,‏ هه الغا ف من pas COL‏ الخال هی سات IGN‏ الاخزی (الارشاط ين 
)11-13( که یک اما تفت Maal kas‏ مشق العدلية اند 


جدول )11-13( تشيعات العوامل ضمن شروط فرضية العاملین اللفظي - الادائي: 





sayy‏ حساب القیم العددية لكل من تشبعات العامل والارتباط بين العوامل » والخصوصية 
بتطبیق العادلات )2-13( و(3-13) او تعمیماتها غانه یمکن استخدام اي معادلة مناسبة 
ta ad‏ وه امعان القن oa a AEN‏ اساسته سا من هذه 
الارتباطات والارتباطات المحسوية من درجات الاختبار فالارتباطات الاولی تعکس القیم 
الافتراضية في حين ان الاخری لا تعکسها . في حالة کون القیم الافتراضية خاطنة فان 
مجموعتي الارتباطات تکون مختلفة تماما .ويؤدي هذا الفرق الى رفض القیم الافتراضية. وقد 
قدم جورزکوج (joreskog,1968)‏ عرضاً عاماً للاسلوب التوكيدي في التحلیل العاملي مع امثلة 
عديدة ومثل هذه التحلیلات يمكن اجراوّها باستخدام احد البرامج التخصصة في التحلیل 
العاملي والبرامج الاكثر شيو عألهذا التحلیل هو Joreskog Sorbom (LISREL V1)‏ 
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سس بسب موی 











مضافاً الى البرنامج الاحصائي SPSS‏ 
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software Inc " 








"scientifis‏ كما أنه 








التمارین: 
الاسكتلندية 





أ- بالاعتماد على هذه الارتباطات, ما عدد العوامل التي يبدو انها تساهم في الارتباطات 
الداخلية؟ وتشبعات العامل المدور بتعظيم التباين للحل ثتائی العامل هو: 





ند Me whey‏ تاغوس ها معايل الأرقاط وین مات الا 
ا جات اسان 

بن عن yal veal‏ ان الاخعیارات تععس‌هانلی ناماد رن espa‏ الارشامطات 
المحسوية وللدونة في مصفوفة الارتباط. 
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د- ما الطائفية لموضوع الهندسة . 

ه- ما التخاصية (أو التفرد) لموضوع الجير . 

و- ما قيمة الحد الادنى المحسوب لدرجات التاريخ؟ 

ز- على افتراض ان معامل ثبات درجات اللغة الاسکتلندية. الانجليزيء التاريخ 0.75 
تقريباً. فهل يمكن اعتبار أي من هذه المتغيرات مقياس أولي (أساسي) للعامل الثاني. 

ح- بإعطاءالنتائج الناسبة, كيف يمكنك التحقق مما إذا كانت هنالك عوامل اضافية تلزم 
لتساهم في معاملات الارتباط. 





2/ استخدمت قائمتصفات LISW‏ فی قیاس حالات مختصرة لانماط الاحباط وتتضمن هذه 
Lala‏ قوائم صفات طلب من الستجییین آن یختاروا الصفة التي تصف الطريقة التي 
بشعرون las‏ أجرى روث ولوبين )1981 (Ruth Lubin‏ تحلیلا عاملیاً لسبعة عشر صفة 

وصححت الاستجابات بالتدریج الثنائی. وان كان مؤشر نمط الكآبة "عدم السعادة على سبیل 
الل غار اتسين فانه يعطق العرجه )1( وان AS‏ موش الما علی يل ان 
واختاره الستچیب كانه یعطی الدرجة (صفر). وکذلك استجابات اخری اعطیت الدرجة 
(صفر). وکانت تشبعات العوامل لتحلیل العامل الدور افقياً على النحو الاتي» مع العلم بان 
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ب-كيف تتوقع لفرد نمطة مكتئب ان تكون درجته على العامل الاول عالية ام منخفضة 
نسبياً؟ لاذا؟ 


ج- فسر معامل الارتباط بين العاملين الذين حددتهما في أ. 
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الوحدة الرايعه 


تحليل الفقرات في تطوير الاختبار 
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الفصل الرايع عشر 
تحلیل الفقرات 


هدف عام لبناء الاختبارات هى الوصول إلى اختبار بأقل عدد من الفقرات ويؤدي إلى 
درجات لها days‏ مناسبة من الثبات والصدق للاستخدامات الخاصة بالاختبار. ویرافق هذا 
تجریب ميداني لعدد کبیر من الفقرات» واختبار مجموعة فرعية منها تساهم بأكبر قدر من 
تبات الاختبار أو صدقه. وفي عملية بناء اختبار جدید (أو اختصار عدد فقرات قید 
الاستعمال) فان الجموعة الأخيرة من الفقرات تحدد عادة خلال عملية تسمى تحلیل الفقرات. 
وتحلیل الفقرات مصطح واسع الاستخدام في تحدید الحسابات واختبار أية خصائص 
احصائية لاستجابات الفحوصین على فقرة اختبارية. ویتم التحقق من معالم الفقرات والتي 
تفع ضمن ثلاث فئات dole‏ هي: 

1. معاملات تصف توزيع الاستجابات لفقرة مفردة fie)‏ المتوسط والتباين للاستجايات 

على الفقرة). 

2. معاملات تصف درجة العلاقة بين الاستجابات على الفقرة وأي محك مناسب. 

3. معاملات عبارة عن دوال لكل من تباين الفقرة وعلاقته بالمحك. 

وسنقدم في الأجزاء التالية صيغاً تعريفية لبعض العاملات الشائعة فى كل فئةء ويعدها 
سنعرض بيانات مثال توضح كيف أن المعلومات عن معالم الفقرات تؤخذ بعين الاعتبار في 
اختيار الفقرات أو مراجعة القرارات في الاختبارات معيارية المرجع. وسيتم تقديم طرق تحليل 
الاختبارات محكية المرجع في الأجزاء الأخيرة من الفصل. 


صعوية الفقرق والتوسط. والتباين: 

عندما تكون الفقرة ثنائية التصحيح فإن متوسط الفقرة يتطابق مع نسبة المفحوصين الذين 
أجابوا على الفقرة إجابة صحيحة» ويرمز لهذه النسبة بالرمز Pi‏ ويطلق عليه اسم صعوية 
الفقرة. ونوقش هذا العلم ببعض التفصيل في الفصل الخامس. تذكر أن قيمة Pi‏ تتراوح بين 
صفر إلى ۰1400 وكما سترى فيما بعد فان معظم معالم الفقرة SL‏ بصعويتها. ويرتبط 
متوسط الدرجة الكلي مباشرة بصعوية الفقرة لأن : 
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Eos PX =w 
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علاوة على أنه عند اهتمامنا بمستوى متوسط الفقرة في الاختبار, فإنه يمكن الحصول 

۱ : علیها من‎ 
)2 1 K / (ux) = Hp 

حيث ترمز K‏ إلى عدد فقرات الاختبار. وعند وصف مجموعات المفحوصين على اختبارات 
عدة أطوالها مختلفة؛ فان متوسط صعوية الفقرة قد يفضل على متوسطات الدرجة الخام 
(والذي يتغير كدالة لطول الاختبار). وكما بين الفصل الخامس فإن مستوى صعوية الفقرة 
يضبط بتباين الفقرة. لأن: 

qi Pi = 2 

كذلك تم تأسيس - وعلى افتراض درجة ثابتة من الارتباط عير الفقرات - أن تباين الدرجة 
الكلي يصل إلى أعلى قيمة عندما تكون :7 = 0.5 .لذا فإنه من المدهش أن نتعلم أنه ولعظم 
اختبارات التحصيل والاستعداد المنشورة المصممة لتفسير درجاتها على آنها معيارية المرجع؛ 
أن صعوبة فقراتها تقع في الفترة 0.80-0.60 ويعود سبب هذا إلى صياغة الفقرات 
الستخدمة في مثل هذه الاختبارات. 

ولفهم كيفية تأثير صياغة الفقرة على قيمة P‏ مثل : 


من الواضح أن فرصة التخمين للمفحوص الذي لا يعرف الإجابة الصحيحة قليلة؛ لذا فان 
قيمة الملاحظة وبالتالي تباينها تعد دلالة لمعرفة المفحوصين (أي الدرجات الحقيقية على 
الفقرة) آفترض الآن أن الفقرة نفسها كانت صياغتها على النحو الاتي: 

e 

186 -í 

ب- 196 

TES 

و - 554 

لأن هذه الصياغة تسمح للمفحوصين بوضع إشارة على الاجابة الصحيحة بالتخمین فان 
قيمة أ اللاحظة تتأثر بکل من درجات الفحوصین الحقيقية على الفقرة والتخمین. وضمن 
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يعرفون الإجابة الصحيحة (قيمة [ الحقيقية) و a‏ ل الإجابة 
taal‏ لاطبال فرق ی ا ا 
Sas Vans ae eee‏ 
eee ۳ ee‏ 


0.5 
مم بالتالي فإن الصعوية الملاحظة للفقرة بأقصى تباين درجة حقيقية يتوقع أن ro‏ 





0.50 fa 
لد‎ + 050 = P, 
جدول )1-14( توزیع الاستجابات وقیم۳ على فقرات موضوعية لها احتمالات استجاية مخنلفة‎ 


CII‏ تست 


ويؤسس جدول )14 -1) كيفية حساب قيم Po‏ لفثرات ذات عبد esta‏ من الال والقيم 
المحسوية في هذا الجدول أقل نوعاً من قيمة P‏ المثالية للاختبارات معيارية المرجع. وأثبت لورد 
(Lord, 1952)‏ في دراسة محاكاة أن الثبات يتحسن عند اختيار فقرات لها قيم P‏ أكبر من تلك 
المحسوبة بالتعديل الناجم عن التخمين وقيم ‏ التي أوصى بها لورد مبينة في جدول )14 -1). 
ومن جهة التطبيق العملي فإن قيم لورد تعتمد تعتمد على بيانات استجابة محاكاة (افتراضية وليست 
واقعية)» مع ذلك فإنها تبقى أكثر معقولية من تلك المحسوبة بنموذج التخمين العشوائي SN‏ 
العديد من المفحوصين لديهم معرفة جزئية تمكنهم من حذف واحد أو أكثر من البدائل الخاطئة 
قبل إجراء عملية التخمين» مما يجعل احتمالية الإجابة الصحيحة أكبر من النسبة ى . 








== 5 


























416 = 








تمييز الفقرات: 
تهدف العديد من الاختبارات تقديم معلومات عن الفروق الفردية سواء على المقياس 
(الاختبار) آو بناء على محك خارجي يفترض أن LEB‏ به درجات الاختبار. وفي كلا الحالتين 
فإن العلم الذي نهتم به في اختبار الفقرات يجب أن يكون مؤشراً لفعالية تمییز الفقرة بين 
الفحوصین ذوي الاداء العالي وذوي الأداء المنخفض على المحك نفسه. ولا يوجد في بعض 
الحالات مقیاس آنسب للبناء من الدرجة الكلية على الاختبار نفسه (الاختبار التحصيلي 
الصفي هو مثال أساسي لهذا الوقف). وفي هذه الحالة تستخدم الدرجة لیا کنمریف. 
اجرائي للموقف النسبي للمفحوص على البناء قيد الاهتمام. . وفي هذا الحك الداخلي یکون 
الهدف تحدید الفقرات التي تکون احتمالية الاجابة الصحيحة علیها عالية من قبل فئة 
الس ادن ومنخفضة في الوقت نفسه من قبل فئة التحصیل التدني وفي الاختبارات 
لتحصيلية على سبيل المثال نقول أن الفقرة تميز أو تفاضل بين المفحوصين الذين يعرفون 
این ما من چهه Sarg 2s E‏ ۵ الف جنات as ged‏ 
الفئتين. فمثل هذه الفقرات یبد آنها لا تقيس البناء نفسه الذي تقيسه بقية الفقرات. ومن غير 
الرغوب به Least‏ آن بكرن هنالك فقرات تفشل Teall‏ العليا في الإجابة عليها إجابة صحيمة 
وتنجح Gall‏ الدنیا في الإجابة علیها بصورة صحيحة: فمثل هذه الفقرات یکون تمییزها 
عالت" ۱ 
وتستخدم خمسة alles‏ على أنها مؤشرات لفعالية تمييز الفقرة وسیتم وصفها في الجزء 
التالي. يعتمد أحدها على التفاضل بين مجموعات من المفحوصين تم تحديدهم من خلال ' 
درجات قطع عند نقاط محددة على توزيع درجات celal‏ والأربعة المتبقية هي أنواع مختلفة من 
معاملات الارتباط. ومن الهم تمییز أن هذه العالم جميعها يمكن تطبيقها بالتساوي على 
المواقف الذي ترتبط درجة الفقرة فيه بدرجة الأداء الكلي أى في الوقف الذي ترتبط فيه درجة 
الفقرة بالأداء على محك خارجي. ومع أن التطبيق الأخير مثيراً للجدل والخلاف Legh‏ ما 
لأسباب سيتم بحثها فيما بعد إلا أن اختيار محك داخلي (الدرجة الكلية) لا يغير من الصیغ 
الحددة آو الطرائق الحسابية. 


دليل التمییز : Index of Discrimination‏ 
هو معلم تمييز بسيط يطلق عليه اسم دليل التمییز يمكن تطبيقه فقط على الفقرات ثنائية 
häll‏ وتفصل المفحوصين إلى مجموعات درجاتهم أعلى أو آدنی من درجات القطع هد‌د. على 











سبيل المثالء إن كان اهتمام مطور الاختبار في اختيار الفقرات التي تميز بين المفحوصين 
[Arr‏ على محك داخلي (درجة الاختبار (UK‏ والمجموعات تتألف من أعلى 9650 وأدنى 9650 
من المفحوصين اعتماداً على درجاتهم الكليةء وكانت مجموعة المفحوصين كبيرة فليس من 
الضروري استخدام الفئة العليا أو الدنيا جميعها. وأجرى كيلي ( 1939 , (Kelley‏ دراسة 
تقليدية تحت شروط معينةء ووجد أنه يمكن الحصول على معامل تمييز فقرة ASÍ‏ حساسية 
واستقراراً عند استخدام أعلى 27 © وأدنى 27 % من المفحوصين وذلك عندما يكون حجم 
العينة كبيراً. وفي الحقيقة يمكن الحصول على النتائج نفسها من خلال أعلى وأدنى 30 % أو 
0 من المفحوصين )1965 , Mendoza , 1979 ; Englehart‏ & ل وحالما يتم 
تحديد الفئتين العليا والدنياء فإن دليل التمييز يحسب ب : 
0ح يوم درط و CAA‏ 
حيث ترمز Pa‏ إلى نسبة الذين إجابى على الفقرة إجابة صحيحة من الفئة العلياء و Py,‏ 
هي النسبة نفسها Gall‏ الدنيا. وتتراوح قيم D‏ بين - 1.00 إلى 1.00). وتشير القيم الموجبة 
إلى تمييز للفقرة يحابي الفقرة العليا من المفحوصينء وتشير القيم السالبة إلى تمييز عكسي 
قرة يحابي الفئة الدنيا. 


جدول )2-14 ): أنماط استجاية توضيحية لعشرة مفحوصين على فقرات ثلاثة مختارة . 





١‏ من 30 فقرة ؛ ومن ا ا ل المثال فقط 
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- لتمييز الفئة Wall‏ (أدنى %30( واستخدمت استجابات أعلى ثلاثة مفحوصين وأدنى BIG‏ 
منهم لحساب D‏ للفقرات (1. ۰2 3) في الجدول لاحظ أن الفقرات 1 ۰ 2 لها قيمة P‏ نفسها 
)0.60( إلا أن قيم D‏ لها alias‏ بدلالة. وقد asd‏ ايبيل )1965 (Ebel,‏ ارشادات لتفسیر قیم D‏ 
اعتماداً على خبرته العمليةء وذلك عندما يتم اختيار المجموعات بناءاً على محك الدرجة الكلية, 

1. إذا كانت ظ > 0.40 , فان الفقرة تلبی الغرض أو الهدف. 

2. إذا كانت 230 ظ < 0.39 , فإن الفقرة تتطلب مراجعة قليلة. 

3 131 كانت 0.20 > D‏ = 0.29 فإن الفقرة تقع على الحد الفاصل وتحتاج إلى مراجعة. 
الممكن الإجابة عن أسئلة مثل ما هي قيمة D‏ وبدلالة عن الصفر؟ أو ما هو مقدار الفرق بين 
D as‏ الدال احصائيا؟ وعلی الرغم من ذلك ولسهولة حساب D‏ وتفسيرها فإن دليل التمييز 
الخصوص في تحليل فقرات الاختبارات الصفية. 


المعاملات الارتباطية للتمييز: 


ناقشنا في الفصل الثاني معامل ارتباط بيرسون على أنه مقياس لدرجة العلاقة الخطية 
بين متغيرين» فإن كان مدى درجات فقرات الاختبار من (1 إلى 4) أو (1 إلى 5) آو AST‏ من 
ذلك fis)‏ فقرات استبانة اتجاهات oy Sul‏ فإنه يمكن استخدام هذه الصيغة لتقدير درجة 
العلاقة بين درجات الفقرة ودرجات المحك. وعلى الرغم من امكانية استخدام صيغة الارتباط 
نفسها للفقرات ثنائية التصحیح, فقد تم تطوير صيغ خاصة أسهل استخداماً في الحسابات 
الندوية عندها كرون وأهدة أو كلا المتغيرين TEL‏ الدرنجا. وسيم وضق معاملات ارتباط 
أريعة في الجزء التالي: 











جدول (3-14): حسابات توضيحية لعاملات التمييز لفقرات جدول )2-14( , حيث ۲ = 19.10 و Oy‏ = 5.17 





معامل ارتباط بونيت بايسيريال: 

عندما يكون مطور الاختبار مهتماً بمعرفة مدى الارتباط بين الأداء على فقرة ثنائية 
التصحيح (درجاتها صقر 1( ودرجة glial‏ الكلية sí)‏ أي مجك al‏ تدريجه متصل). 
بایسیریال» ويعرف على النحو التالي: 


Tq KF BS 
(5-14) ل‎ q/P or = Pobis 


حيث يرمز با إلى متوسط درجة المحك للذين أجايوا على الفقرة إجابة صحيحة: ور 
إلى متوسط درجة المحك للمجموعة الكليةء Oxy‏ إلى الإنحراف العياري» و P‏ إلى صعوية 
الفقرةء و ٩‏ = 1 - م. ويبين جدول )3-14( حساب معاملات ارتباط بونيت بایسیریال بين 
الدرجة الكلية ودرجات الفقرة وذلك للفقرات المدونة في جدول )2-14( 

وتكون قيمة معامل ارتباط بونيت بايسيريال نوعاً ما أكبر من القيمة الحقيقية, وذلك OM‏ 
درجة الفقرة لها مساهمة في الدرجة الكلية لكل مفحوص. فإن كان عدد الفقرات كبير نسبياً 
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)25 آو أكثر) فان هذه الحقيقة ناذراً ما تؤدي إلى مشكلةء وعليك تصحيح الصيغة بحل 
المشكلة للعدد القليل من الفقرات باستخدام الصيغة: 


O; ~O Oy; 
(6-14) ET سمه‎ eG) 


Oj Oy Pxi 2 - 0,20? 


حيث ترمز رى pi‏ إلى معامل ارتباط درجة الفقرة بالدرجة الكلية بحذف الفقرة المعينة 
بمعامل الارتباط ,© ;© إلى الانحرافات المعيارية للدرجة الكلية ولدرجة الفقرة على التوالي. 


معامل ارتباط بایسیریال: 

سات ا كر رون لاضن E E o‏ فمن المکن 
اشتقاة ق صيغة للارتباط بين هذا التغیر ومحك توزیعه متصل fio‏ درجة الاختیار. وقد اشتق نو 
هذا الاحصائى فى البداية من قبل بيرسون )1909 , Pearson‏ وأطلق عليه اسم معامل ارتباط 


(TVA) ۰... دی‎ ۱ (y/P) aces = Prin 
هي‎ Ux إلى متوسط درجة المحك للذين أجابو على الفقرة إجابة صحيحة: و‎ Uy حيث ترمز‎ 
إلى نسبة الذين‎ Py إلى الإنحراف المعياريء‎ Ox متوسط درجة المحك المفحوصين جميعهم و‎ 
اجابوا إجابة صحيحة على الفقرة و لآ إلى الإحداثي ¥ المنحنى الاعتدالي العياري عند‎ 
الدرجة الزائية المرتبطة بقيمة  للفقرة. فعلى سبيل الثال للفقرة 1 في جدول 2-14 کانست‎ 
أكبر من0.50. وبالعودة إلى جدول المنحنى الاعتدالي المعياري في‎ Py ويما أن‎ P1 - 0 
الساحات إلى الیسار) للدرجات الزائية‎ of) فاننا سنختار عمود الاحتمالات‎ A الفهرس‎ 
,0.3867 الوجبة. وقيمة الساحة الأقرب إلى 0.60 هی ۰0.599 والاحداثي الرتبط بها يساوي‎ 
وباستخدام هذه القیم في‎ o: Hs He قیم‎ eae ومن بييانات جدول )2-14( يمكننا‎ 
lt ا ع‎ e .3 2 1 ارتباط بایسپریال للفقرات‎ ETE 

الناتجة عن معامل ارتباط بوينت بايسيريال. 
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ورياضياًء فإن العلاقة بين معاملات ارتباط بايسيريال ويونيت بايسيريال هي: 


P 
(BA) Gentes pls | Spa: 


ولأن قيمة احداثي۷ على النحنی الاعتدالي اقل من قيمة ,|۲9 e‏ فان قيمة معامل 
بايسريال يكون على الأقل أكبر من ارتباط بونيت بايسيريال ب ل للمتغيرات نفسهانگ (Lord‏ 
Novicck ,1968(‏ ويكون هذا الفرق الكسري غير متحيز للفقرات متوسطة الصعوية, 
ويانخفاض قيمة 0 إلى ما دون 0.25 أى ارتفاعها إلى أعلى من 675 فان الفرق بين معاملي 
الارتباط يزداد بحدة. وقد أثيت ماغنسون totu (Magnusson)‏ أنه عند مدى الصعوية 
التطرف يكون معامل ارتباط بايسريال أكبر 4 مرات من معامل ارتباط بوينت بايسيريال بين 
درجة الفقرة والدرجة الكلية. لاحظ أن النسبة بين المعاملين فى جدول (3-14) للفقرة 3 أكبر ب 
)1.67( منه للفقرة 2 )1-23( آو الفقرة 1 (1.28). وظهر هذا بسبب انخفاض آثر تاين الفقرة 
الذي يعمل علی تقیید قیمة معامل ارتباط بونیت بایسیریال. لاا فلمستخدمي الاختبارات 
الذين یقارنون بين تقاریر تحلیل الفقرات للدراسات الختلفة التي تستخدم صیغ معاملات 
ارتباط مختلفة علیهم تذکر أن معامل ارتباط بایسیریال آکبر وبانتظام من معامل ارتباط بوتیت 
بایسیریال» وبالتالي فان هنالك فروقات واضسحة في قیم معالم تمییز الفقرة تعود إلى الصيةة 
الستخدمة في حساب معامل الارتباط لا إلى الفروقات النوعية بين الفقرات. 
معامل ارتباط فاي: 

Leste‏ نرید حساب معامل ارتباط فقرات ثنائية التصحیح ودرجات محك ثنائي (مثل 
ناجع وراسب في برنامي Sale!‏ التاهیل, ای خصائص دیمواغرافیة نكل الجنس) یمکننا 
استخدام معامل فاي البین في الفصل الخامس. واست‌خدام آخر لهذا العامل هو تحدید 
درجة الاستقرار في الاستجايات للفقرة نفسها ثنائية التصحيح aaa ck E)‏ و 

موقف آخر مختلف. ويكون استخدام معامل فاي مناسباً اکثر عندما تكون المتغيرات ثنائية 

حقيقية. فعند تشكيل مجموعات محكية باصطنا ع درجة قطع على توزيع التصل. فإن هذا 
الإحصائي لا يسمح باستخدام تام للمعلومات المناسبة. بكلمات أخرى عند تصنيف 
المفحوصين الذين أعلى من درجة القطع بالدرجة 1 وأدنى منها بالدرجة صفرء فان المعلومات 
الكمية حول الفروق بين الدرجات في النجاح والفشل ستضيع. ومحدد آخر محتمل لمعامل 
فاي هو أن قيمته تساوي ‏ عندما تكون قيمة ! لكلا المتغيرين متساوية فقط (وذلك GY‏ مثل 
معامل ارتباط بایسیریال النقطي پشتق مباشرة من معامل ارتباط بیرسون). 
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معامل ارتباط تتراشورك: 

عندما يهتم مطوّر الاختبار بدرجة الارتباط بين متغيرين ثنائيين عندما يكون كلاهما ناجماً عن 
تحويل متغير متصل تحويل إلى متغير متقطع ثنائي. ومن المناسب في مثل هذه الحالات 
استخدام معامل ارتباط تتراشورك. وحساب هذا الاحصائي معقد fag‏ ونادراً ما يتم حسابه إلا 
في حالات الاعتقاد القوي به من قبل مطور الاختبار أكثر من أي معامل آخر مثل معامل فاي 
الذي لا يكون مناسباً للهدف. واحد هذه المواقف في حالة اجراء تحليل عاملي وتكوين مصفوفة 
الارتباطات الداخلية of a‏ ثنائية التصحیم. ولان قیم معامل فاي مقيدة فیما عدا کون قیم ۳ 
متساوية؛ فان مثل هذه الارتباطات تکون آقل ملائمة من معاملات تتراشورك للتحلیل العاملي. ولا 
تعرض صيفة معاملات تتراشورك بسهولة واکن یتوافر برامج محوسبة في العدید من الحقائب 
المحوسية لحساب هذا العامل انظر على سبیل .(Dixonietal 1981) JÈN‏ 
مقارنة بين معاملات نمییز الفقرة: 

تم عرض خمسة طرائق مختلفة في حساب تمییز الفقرة. ومن الواضح في بعض الواقف 
بسبب تصحیح التغیرات فان إحدى التقنیات تکون آکثر ملائمة من غیرها . ومن النطق طرح 
سؤال حول تشابه النتائج الحصلة من الطرائق الختلفة. وتناولت عدة دراسات تجريبية هذه 
القضية فقد استخدم انجل هارت ( 1965 , (Englehart‏ استجایات 210 مفحوصین تقدموا 
لاختبار كفاءة الدرسة لعلیا وباستخدام الدرجة LISI‏ کمحك. آجری حساب معاملات تمییز 
متنوعة Ly‏ فیها D‏ فاي. بایسیریال ۰۵ بوینت بایسیریال P‏ وتتراشورك 0. وعندما حسبت 
معاملات معاملات الارتباط بين هذه العاملات تراوحت الارتباطات بين أزواج معاملات التمییز 
بين 0.85 إلى 0.99 ومن 0.90 إلى 0.99 على الصيغة الوازية ودونت دراسات مشابهة من 
قبل )1956 , (Beuchert & Mendozaa , 1979, Oosterhof , 1976 , Findley‏ وفي معظم هذه 
الدراسات ظهرت الفجوات الأكبر للفقرات متطرفة الصعوية. 

كخلاصة: يمكن تقدیم التوصیات التعلقة باختیار طريقة تمييز الفقرة للفقرات ثنائية 
التصحیم الآتية: 

1. عندما تکون الفقرات متوسطة الصعوبة یکون الفرق بين إحصائيات التمییز Jal‏ فان 

كان الهم سهولة الحساب ينصح باستخدام D‏ ون كان الاهتمام في اختبار الدلالة 
الاحصائية ينصح باستخدام إحدى الطرائق الارتباطية. 


2. وان كان الهدف اختيار الفقرات متطرفة الصعوية يوصى باستخدام معامل ارتباط 
بایسیریال Lad‏ لو كان من النطقی افتراض التوزیع الاعتدالي للسمة lM BRAG‏ 








3 عندما يشك مطور الاختبار باختلاف قدرة العینات الستقبلية عن عينة تحلیل الفقرأت, 
و باستخدام معامل ارتباط بایسیریال إذ أن رتبة تمییز الفقرة في هذا الاحصائي 
كين GIST‏ استقرارا من hi‏ ر ع یر ی ا انر 
أن قيمة معامل ارتباط بايسيريال النخفضة لعينة من أي مستوى قدرة يشير إلى أن 
الفقرة منخفضة في قوتها التمييزية. ولكن قيمة معامل بونيت بايسيريال النخفضة 
الفينة منخفضة القدرة (آو Lille‏ القدرة) قد تکون ببساطة دالةالمتعوية الققرة ولیست 
بالضرورة مؤشراً لضعف تمییزها. 

4. وان كان مطور الاختبار يثق ودون تحیز بأن العینات الستقبلية مشابهة في قدرتها 
لعينة التحلیل» وکان الهدف اختيار فقرات old‏ اتساق داخلي عالي فیفضل استخدام 
معامل )415 بونیت بایسیریال ( 1968 , (Lord & Novick‏ ومع أن هذا لم يتم اثباته 
بشکل نهائي إلا أنه يبدو منطقیاً من خلال حقيقة ان قیم معاملات بونیت بایسریال 
كين ا انات مو الكو وی فتاه الق ات مع E‏ شور 
بين الفقرات وبالتالي أعلى قيمة لعامل الفا. 

5 وفي حالات التدریج الثنائي لكل من الفقرة والمحك, ينصح باستخدام معامل فاي 
آوتتراشورك» وحساب معامل فاي اسهل ولكنه محرر عندما تكون النسب غير متساوية 
لكلا المتغيرين. ويعتمد معامل تتراشورك على افتراض ان درجات الفقرة والحك تظهر 
عند تحويل متغيرين توزيعها اعتدالي الى متغيرين ثنائيين. ونادرأماينصح باستخدام 
هذا المعامل كمقياس لتمييز الفقرة للتعقيدات في حسابه. ولكن يوصى به بقوة عندما 
يراد استخدام الارتباطات الداخلية في التحليل العاملي. 

معاملات ثبات الفقرة وصدقها : ۱ 

الفئة الثالثة من alles‏ الفقرة في دراسة تحلیل الفقرة یعرف بمعامل ثبات الفقرة ومعامل 
صدقها: وکل Lage‏ دالّة لثباين درجة الفقرة وارتباط درجة الفقرة بالحك. فان كان الحاه 
الستخدم داخلی: TASH Za yall‏ علی الاختبار, فان العامل یعرف على انه Pig Oj‏ « حیت 
تشیر Pig‏ الى BLE‏ بين درجة الفقرة والدررجة الكلية. ویطلق على هذا العامل اسم معامل 
ثبات الفقرة, وتکتب هذه الصيغة بشکل أكثر شیوعاً للفقرات الثنائية ‏ [0 :0( حيث 


ترمز Pix‏ إلى معامل ارتباط بونیت بایسیریال بين درجة الفقرة والدرجة الكليةء وعند 
استخدام dae‏ خارجي فان العامل يحدد ب Piy Oj‏ حیث ترمز Piy‏ إلى الارتباط بين درجة 
الفقرة ودرجة الحك الخارجي. وعندما یکون الهدف من اختیار الفقرات هو تحسین cold‏ 
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درجات الاختبار أى صدقها يتم ذلك باختيار الفقرات التي تميز على المحك. وقد يقترح أحياناً 
استخدام معامل ثبات الفقرة (آو معامل صدق الفقرة) كبديل للارتباط البسيط بين درجات 
الفقرة والحك. وذلك لأن تباين الفقرة يؤازن بالفعل مساهمة فقرة معينة لثبات درجات 
الاختبار الكلي أى صدقه. وإن كان هنالك فقرتين (على سبيل المثال) لها ارتباطات متساوية مع 
الدرجة الكليةء وتباين أحداهما آکبر. فان الفقرة ذات التباین الأكبر تساهم أكثر في ثبات 
درجات الاختبار لذلك يجب ملاحظة أنه كلما كانت الفقرات المختارة متوسطة في صعويتها 
فان هنالك ميزة إضافية عملية قليلة فى استخدام معامل ثبات الفقرة بدلاً من معامل ارتباط 
ويكون معامل OLS‏ الفقرة أو صدقها مفيداً في بعض الواقف في بناء الاختبار. ويمكن 
تبين أنه يمكن التعبير عن تباين الدرجة الكلية بمجموع ثبات الفقرات» لذلك فإن: 
O40) anc ۱ (Pixo =O,‏ 
وقد يفيد هذا في تحليل الفقرات عندما يضع مطور الاختبار أدنى قيمة مرغوية لتباين 
الدرجة الكلية. وحالما fag‏ عملية اختبار الفقرات فإن مجموع معاملات ثبات الفقرات يزداد 
بإضافة كل فقرة حتى يظل الأدنى قيمة مرغوية لتباين الدرجة الكليةء ويحسب هذا ببساطة 
أكبر بإضافة درجة الفقرة وإعادة حساب تباین الدرجة الخام الكلية عند إضافة كل فقرة. 
بصورة مشابهة» فإن وضع مطور الاختبار أدنى قيمة لمعامل الاتساق الداخلي كما يقاس 
بمعامل الفاء فإنه يمكن إعادة حساب معامل الفا بعد إضافة كل فقرة باستخدام بيانات على 
مستوى الفقرة فقط من خلال الصيغة: 
3 6 ( 


)10-14( ۰۰۰۰۰ ST REE 
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k 
-1 ( ي‎ hee 
-1 
الفقرات المختارة.‎ sac إلى‎ K حيث ترمز‎ 
وأخيراً , أن كان مطوز الاختبار يرغب في تخصيص أدنى قيمة لمعامل الصدق بين‎ 
۱ Pxy که‎ 5 


11-14( سا م‎ E 
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ويجب ملاحظة أن قيم التباين ومعامل الفا ومعامل الصدق المحسوية من معاملات ثبات 
لفقرة تکون تقريبية. وذلك Losi‏ تحصل على Pig‏ من تحلیل الفقرة للفقرات جمیعها من 
التجریب اليداني للفقرات لا من خلال الفقرات الختارة من الجموع الکلی. ولاشتقاق هذه 
صیغ العلاقة بين معالم الفقرة ومعالم الدرجة الكلية یمکن الرجوع إليها في, (Gulliksen‏ 
)1950 و )1968, (Lord & Novick‏ 


إجراء دراسة تحليل الفقرات: 
التجریب اليداني وتحلیل الفقرات: نظرة dale‏ ۱ 

۱ لغاية الآن من الواضح أن خصائص الدرجة الكلية دالة للفقرات التي تولف الاختبار. لذا 
فان آراد مطور الاختبار الحصول على درجات بأقل قدر من Lhd‏ القیاس» أو آنها ذات علاقة 
قوية بمحك الأداء أو قياسات GUY‏ أخرى فلن يكون كافياً کتابة الفقرات ثم Jol‏ بالافضل " 
فحالا يتم GUS‏ الفقرات جميعها ومراجعتها والتجريب الأولي لهاء ثم بعدها يمكن تطبيقها 
لاختبارها ميدانياً على عينة ملائمة من الفحوصین. ويحدد مطور الاختبار خلال تحليل 
الفقرات التي تؤدي وظيفتها وتلك غير اللائمة, وفي معظم الحالات يحتفظ مطور الاختبار 
بالفقرات الأولى» ويراجع الفقرات غيرالملائمة أو يقوم بحذفها. وفي تحليل الاختبار النموذجي 
على لون الاكتبار امراء الخطواف ES‏ 
. حدد خصائص درجات الاختبار الأكثر أهمية. 
: حدد معالم الققرة الاکثر ما لهنه الخصائض. 

E‏ الفقرات على عينة مفحوصین ممثلة لجتمع الفحوصین الستهدف في الاختبار. 
. احسب المعالم المذكورة في الخطوة الثانية لكل فقرة. 
. سمس خطة لاختيار الفقرات (آو تحديد الفقرات التي تحوي قصور ثم راجعها). 
. اختر المجموعة النهائية من الفقرات من الملف الإجمالي. 
. قيّم للتحقق من النتائج وذلك بإجراء دراسة صدق تقاطعي. 

وفي الأجزاء السابقة من هذا الفصل حددنا معالم الفقرة التي تهمنا على الأغلب 
وعرفناهاء وذلك لأهمية علاقتها بمعالم الدرجة الكلية. وكذلك عرضت الصيغ الرياضية 
اللازمة لحساب هذه المعالم. وفي الاجزاء الآتية سنركز على الخطوات 3. 65 6: 7 بالتسلسل 
السايق نفسه. 


حم الح PW‏ ہا SID‏ 
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حجم العینة: 

eas ae‏ دول عدون pea‏ في تخل الفشر ات ومن المؤكد أن 
تحلیل اختبار يستخدم بكل واسع مثل GRE‏ أو of Laat‏ الاستعداد أو التحصيل لنشورة 
تجارياً يجب أن تعتمد على dine‏ ممثلة وكبيرة: وبالطبع آلاف من الفحوصین. بالقایل طالب 
الدکتوراه الذي يطور آداة لأطروحته يجب أن يعتمد على عينة آصغر من هذه بکثیر وکقاعدة 
عامة يمكن حساب معظم المعالم الوصوفة قي هذا الفصل بعینات مستقرة نسبیاً ومؤلفة من 
sary ype te 0‏ هذا أقل عدد مرغوب. وقانون FP‏ هى أن يكون عدد 
الملفحوصين من 5 إلى 10 أضعاف عدد الأفراد (1967, (Nunnaly‏ وان استخدام soles‏ 
الاختبار هذا المؤشر فإنه سيستخدم على الأقل 100 مفحوص لكل فقرة. وحجوم العينات 
اللازم لحساب alles‏ الفقرة في نظرية IRT‏ يتراوح من (200 إلى 1000) مفحوص بالاعتماد 
على النموذج الختار في التحليل. ومن الضروري لطّور الاختبار ان يعرف طرائق الاختبار 
التي سیطبقها عندما يخطط للتطبيق الميداني» لذا فإنه سيتم التطبيق على عدد كاف من 
المفحوصين. نقطة أخرى يجب اخذها بعين الاعتبار هو الحاجة الى دراسة صدق تقاطعي. 
والذي سيتم عرضه باختصارء وتتطلب المرحلة النهائية في دراسة تحليل الفقرات اختبار 
أفراد اخرينء بالاضاقة الى الذين استخدمت استجاياتهم في حساب معالم الفقرة . 
تأسيس خطة لاختبار الفقرات: 

تاريحياً. هنالك قضية خلافية في تطوير الاختبارحول ماإذا كان اختيار الفقرات المرتبطة 
الو الكلية (والتي ينتج عنها دص سید ساق داخلي (ole‏ هو ا ام 
GT ee‏ يمح O ND a‏ 
قليل. وهنا يكون معنى وتفسير درجات الاختيار على انها مقياس لليناء معرضا للمساءلة 
(انظر (Travers,1951‏ من جهة اخرى كلما كان ارتباط الفقرات مع بعضها البعض اکبر 
كلما كان التباين القليل الضاف الى المحك يعزى الى تجمع الفقرات. وعلی مطور الاختبار 
تذكر نقطة مفتاحية في تعيين المحك الذي سيستخدمه في تمييز الفقرات وهى أنه يجب اختبار 
المحك من خلال الهدف المحدد للاختبار والمشابه للمنظور الذي سيستخدمه. فكلما كان A‏ 
فريد لتنيؤ الاختبار بالاداء على محك مفرد كلما ازدادت منطقية pal‏ الفقرات التي ترتبط 
بهذا المحك. مع ان هذه التفردية للهدف في استخدام الككتنان تادرا Linas‏ ؛ والاكثر شيوعاً ه هو 
تطویر الاختبار لیمثل نطاق سلوك ان التنه AG‏ المستقبلي الذي لا يمكن تحديده بوساطة 
محك مفرد. وفي مثل هذه الحالات فان اختیار الفقرات التي تعظم القدرة Gall‏ للاختیار 
على محك معين في موقف تطبيقي محلي, »> ودون الحاجة الى ادلة لعلاقة الفقرات بالیناء 
الواسع الذي نهتم به. وهذا يوّدي الى محدودية فائدة الاختبار في مواقف اخری حيث یختلف 
elati‏ او مجتمع المفحوصين قليلاً . مع ذلك فان ن العدید من مطوري الاختبارات یکتبون فقرات 
تقيس السمة المقصودة » واختيار الفقرات التي من خلال تحليلها بالاعتماد على الدرجة الكلية 
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على الاختيارء ومن بعدها تقييم GAS‏ أرتباط درجات الاختبار كمقياس للبناء بمحك خارجي 
اکش. 

وفي اختیار الفقرات المجرية میدانیا من اجل الاحتفاظ بها في الصورة النهائية للاختبار, 
وهنا يواجه مطور الاختبار بأحد الواقف الآثية :في البداية يوجد عدد فقرات اکبر بکثیر من 
التي ستطبق خلال التطبیق الروتيني للاختبار» ولتوفیر الوقت في العملية الاختبارية 
والتصحیح فان مستخدمي الاختبارات يريدون تطبیق آقل عدد ضروري من الفقرات . لذلك 
فإن الهمة تکمن في اختیار مجموعة فرعية من الفقرات تؤدي الى اکبر مساهمة في الستوی 
الرغوب لثبات الدرجات أوصدقها وباقل عدد ممکن من الفقرات. وسیتم مناقشة اهمية معامل 
ثبات الفقرة (اومعامل صدقها) في الحال. وفي الوقف الثاني عندما یکون All‏ الاختباري 
ليس كبير» ويريد مطور الاختبار الاحتفاظ بكل فقرة تساهم ایجابیا في معلم درجة الاختبار 
الذي يهتم به بشكل أساسي. وفي هذه الحالة يجب تأسيس أدنى حد لعلم تمییز الفقرة ومن 
ثم الاحتفاظ US‏ فقرة لها معلم تمييز اكبر من هذا الحد الادنى. واقترح ايبل )1965 (EBEL,‏ 
محك يمكن استخدامه لتقييم معامل التمييز. ففي حالة العاملات الارتباطية يختار مطور 
الاختبار كل فقرة لها ارتباط مع المحك اكبر من الصفر ويدلالة احصائية وفى حالة معاملات 
ارتباط فاي ويوينت بايسيريال. يمكن استخدام تقريب مناسب للخطأ المعياري لعامل ارتباط 
بيرسون لتأسيس هذا الستوی, وذلك بحساب: 
1 


A‏ سف لس بت وس 


VIIA) 5 = O 
TN 
حيث ترمز  الى حجم العينة» (وعند استخدام هذه الصيغة يكون حجم العينة على‎ 
الاقل50). وغالباً ماتقع القيم الحرجة على بعد 2 انحراف معياري أعلى من الصفر, لذا فإنه‎ 
لعينة حجمها 101 فإن‎ 
1 
10 
و 0.00 + 2 (0.1) = 0.20 لذا فإننا سنحتفظ بكل فقرة لها قيمة معامل يوينت بایسیریال‎ 
أو أكير.‎ 0.20 
والخطأ المعياري لمعامل بايسيريال يمكن حسابه من الصيغة:‎ 


Geass ۱ 2 ais 
y 


.حيث يرمز 7 الى نسبة الذين اجابوا اجابة صحيحة على الفقرة و =q‏ (1-م)» و N‏ الى 


01 = ae 
= Op 


== 427 


















































حجم العينة و لا الى احداتي المنحنى الاعتدالي عند قيمة م (Kurtz & mayo,1979)‏ وثانية 
یمکن استخدام الخطأ العياري هذا في ایجاد الحد الأعلى للفترة حول الصفر. لذا فإنه یمکن 
تحدید الفقرات التي ارتباطها آکبر من التوقع عن طریق الصدقة. ویکون الخطأ المعياري 
لعامل بایسیریال اقل عندما تکون م -0.50 ویزداد عندما تصبح قیم أ متطرفة. لذا فان 
استقرار هذا الاحصائي من The‏ لاخری يتأثريقوة بصعوبة الفقرة. 

وفي تطویر استراتيجية اختیار الفقرات فإن مطور الاختبار البتدی» قد یتفاجاً من كيفية 
تأثير بیانات صعوية الفقرة على القرار. وهناك عدة ملاحظات مناسبة لهذه القضية. 

الاولی: تعد صعوية الفقرة محك اساسی فى اختیار الفقرات. ولکنه آقل آهمية من تمییز 
الفقرة في الاختبارات المعيارية . بن 

الثانية: تتغير قیم ‏ من عينة لاخرى. (يمكن حساب خطا المعاينة لصعوبة الفقرة باستخدام 
الخطأ العياري للنسبة ٠ N/Pq\, = Ôp‏ حيث N‏ هي حجم العينة . 

الاخيرة: في الاختبارات المتوقع انها تميز بثبات على مدى واسع من القدرة يجب ان تكون 
rar Fea 0‏ وموحدة. A‏ مدى paai‏ عديدة بنى نی ناشروا عدم 
faa he JÈ‏ التطبیق استراتيجية اختيار الفقرات من ن المدى متوسط الصعوية E‏ 
للتخمين لفقرات الاختيار من متعدد. وهناك دراستين تأثرتا بهذا التطبيق اجراها كل من لورد 
9(Lord 1952)‏ كرونباخ ووارینجتون ( 1952 (Cronbach & Warrington‏ ,عم ۳ بينت الدراستين 
انه عندما یکون ارتباط الفقرات مع الدرجة الكلية متوسطاً فإن الفقرات متوسطة الصعوبة 
الوحدة تسمح بتمییز LA‏ اكير بين الفحوصین عبر مستویات القدرة جمیعها علی وجه 
التقریب اکثر مما هو في حالة تجمع فقرات عبر مدی اوسع من الصعوية, واکثر تحديداً 
اقترح هنريسن )1971 . (Henryssen‏ أنه عندما يكون متوسط معامل بایسیریال بين الفقرة 
والدرجة الكلية فى المدى بين 0.30 إلى 0.40 يجب ان يتراوح المستوى المثالي لصعوبة الفقرة 
بين 0:40 إلى 0.60: ولكن بازدیاد معدل معامل بایسیریال ASI‏ من 0:60 یکون مدی اکبر من 
الصعوية مقبولاً. ويمكن تمييز احد الاستثناءات لهذه الاستراتيجيةء وذلك عند استخدام 
درجات الاختبار على وجه الحصر في اتخاذ قرارات حول المفحوصين عند النهاية العليا آو 
الدنيا للتوزيع» على سبيل JEU‏ عندما يستخدم الاختبار في اختيار المتقدمين لبرنامج تدريبي 
متخصص وبالتنافس, فانه سيتم اختيار المتقدمين الاكثر تأهيلاًء وهنا يكون من المناسب 
اختيار ol gall‏ ذات قيمة أ النخفضة (أي الفقرات الصعبة) لان هذه الفقرات تؤدي الى نتائج 














تميز بين الفحوصین على القدرة العينة. وعندما يتم بناء اختبار لاختيار فئة من المجتمع فإنه 
من المهم لطوّر الاختبار ان يبين الاستخدام القصود بوضوح. إذ ان فائدة الاختبار لفحوصين 
عند سقو فة gl‏ يكو اقل anal‏ 
استخدام بيانات تحليل الفقرة في مراجعة الاختبار: 
يستهدف عرض دراسة الحالة في تحليل الفقرة التالية لتوضح 
[/رأكتشاف ail al AW‏ تضم تخالل pied gh‏ 
2/ استخدام بيانات استجابات المفحوصين في تشخيص القصور الحتمل في col all‏ 
وتبين بيانات الدراسة استجابات 50 مفحوص على 35 فقرة في اختبار صفي لمرحلة 
الدراسة الأولية وياستخدام تدريج معياري المرجع واستخدم المعلم محك داخلي (درجة 
الاختبار الكلية) في حساب معاملات تمييز الفقرة. ويبين هذا المثال بيانات الفقرات من 
21 إلى 35 . 
ويمثل جدول (4-14) مخرجات برنامج احصائي يجري تحليل للفقرات تبين المخرجات 
اثنين من احصائيات تمييز الفقرة. وصعوية الفقرة ونسبة المفحوصين الذين اختاروا كل بديل 
اجایة. 
ويفيد تمییز الفقرة في هذا الوقف في تحدید الفقرة " المشكلة "» ویفید مستوی الصعوبة 
ونمط توزیع الاستجابة في تشخیص في تشخیص القصور في بناء الفقرات التي ينتج عنها 
تمییز ضعیف وبتطبیق محك ایبل على قيم D‏ فإننا نعد الفقرات 22 23, 28 29 32, 34, 
5 فقرات جيدة لان D pad‏ لها نتجاوز ۸0.40 وعند تحدید قيمة معامل بوینت بایسیریال عند 
Óp + ......۰‏ فإن اقل قيمة مقبولة لعامل بوینت بایسیریال لهذه العينة -0.29 (لعينة 50 
مفحوص), لذا فإننا سنختار الفقرات نفسها التي اخترناها بناءً على قيم D‏ بالاضافة الى 
الفقرة 30 وتشیر هذه النجمة بجانب الفقرة في الجدول )4-14( إلى ان الفقرة مقبولة على 
كلأ من محكي التمییز. ومثل هذه الفقرات يتم الاحتفاظ بها دون مراجعتها. ولتحدید الفقرات 
التي بحاجة الى مراجعة سنستخدم محك ایبل من خلال قيمة D‏ اذ تکون اقل من 0.20‏ 
وحددت هذه الفقرات بوضع خط تحتها في جدول 4-14 وفي اختبارنا كانت الفقرات. المشكلة 
ستة وهي: 21, 24 25 226 31 33. (لاحظ ان الفقرة 30 هي الفقرة الوحيدة التي لها قيمة 
معامل بوينت بايسيريال مقبولة» ولكن قيمة D‏ غير مقبولة. وفي هذه الحالة نكون أكثر ميلاً 
للاسترشاد بمعامل بوینت بايسيريال الذي يعتمد على استجابات المفحوصين جميعهم. 
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جدول )14 - 4) توضيح لنتائج تحليل الفقرة لمفحوصين عددهم 50 
على الفقرات من 21 إلى 50 في اختبار عدد فقراته 50 3 
+ الاجابة الصحيحة × فقرة تمين بفعالية - فقرة تمییزها ضعيف 
والفقرة 21 لها تمييز سالب وفقا Jalal‏ بوينت بايسيريال وتظهر هذه الفقرة شاذة جداً 
أن 9052 من المفحوصين إختاروا الاستجابة 3 بدلاً من 4 والتي هي الاجابة الصحيحة: ولان 
هذه dius‏ عالية وغير طبيعية فى اختيار الاستجاية الخاطئة نفسهاء فهنالك احتمال منطقي 
لان تكون الفقرة خاطئة (miskeyed)‏ وفحص محتوى الفقرة أظهر أن هذه الحالة غريبة. 
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کذلك كان تمییز الفقرة 24 مالا ویظهر انها اکذر صعوبة مما هو متوقع =P)‏ 0.28( ولکن 
تتوزم استجابات الفحوصین بالتساوي عبر البدائل الثلاث ویظهر انها كات عشوائية, 
ويشير العدد الاکبر من الحذوفات الى ان الفحوصین مرتبکین حول ما يسألون عنه ومثل هذا 
النمط من الاستجابات يقترح احتمالات ثلاث لها: الكلمات غامضة في متن الفقرة لذا فان 
الفحوصین لم يفهموا السؤالء او ان الفقرة تغطى محتوى غير مألوف لهؤلاء الفحوصین, وأنه 
لايوجد اجابة صحيحة في هذه الفقرة آو اعادة صياغتها بشكل كامل. 

AGS Glas کیب اه‎ Ra E S نهنا‎ E أن القق رابت‎ aaa 
أعلى قليلاً من المثالي. فمن‎ )0.72= P) فالفقرة 25 الاضعف تمييزاً لها مستوى صعوية‎ 
أن اليل 3 ك بور عليه واه نامعن الهاج من‎ gp وز الانتججابة‎ 
(a E EEE موقل‎ EN EN Aa Sa E 
وفي مراجمة الفقرة نجد انه یجب استبدال البدیل 3 ببدیل اکثر منطقية‎ cued ll عن طریق‎ 
على آمل أن یجذب الفحوصین غير المتأكدين من الاجابة الصحيحة. وينصح ايضاً مراجعة‎ 
مان هد‎ EENE een me meron EA preemies قرو | حجان ] موس‎ 
الفقرة. لتحديد ما إذا وجدوا بديلاً معيناً جذاباً وتحتوي الفقرة 26 خطأين غير وظيفيين‎ 
(البدیلین 1 ۰ ۰)2 والشكلة الاکبر فی هذه الفقرة هو آن 9:52 من الفحوصین اختاروا الاجابة‎ 
الفا من تا حتاف الى‎ pial eaa الخاطة تفا وواضع أ يجن مراجعة‎ 
البدیلین 1.2 لتصبح أكثر‎ LES انه يجب مراجعة البدیل 3 كي یصبع اقل جاذبية. ویجب اعدة‎ 
جانبية. ویجب ملاحظة أن الغموض في متن الفقرة أحياناً یجعل نسبة كبيرة من الفمحوصین‎ 
EEE مج‎ a E ان‎ aa 

ولم تقدم نتائج تحلیل الفقرات 31ء 33 مؤشراً معيناً لضعف تمییزها. لذا فان التمحیص 
الجید لحتوی هذه الفقرات والاستجابات الخاطئة التي اختارتها الفثة العليا قد تکون 
ضرورية لتحدید AIA‏ 

اخيراً. حتی الفقرة 35 التي یظهر ان لها تمييز فعال عاليء فان هذا تم تحقيقه لان نسبة 
انناضنية من (اتخوصمخ لم جيرا على مف الققرة انا القذرة تخیر فى اعفان لذا 
موقم ويد ادر inte Yi‏ فلن لا ام بام :الوقت الکافی تمحر هنن کافه لكان 
الاختبار. ۱ 

وفي العملية الاختبارية الصفية old‏ معظم الجهات السوولة توصي باستخدام بیانات 
sail‏ كسام فى مزاععة لحار سيكتلا ولکتهم لا مین ASIAN Aad‏ 
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عند حساب درجات | لصف الحالي الذي اختبر بها. فا لطلبة عند تقدمهم لاختبار فإنهم 
يفترضون ان الفقرات جميعها تحسب في الدرجة, وهم لا يعتبرون التضحيح عادلاً فيما لو 
اختار المعلم مجموعة فرعية من الفقرات لاحتساب درجتها في الاختيار. وقد وضح كوكس 
(COX , 1965)‏ ان بناء الاختبار على اساس معاملات تمییزها فقط لا تکون مقياساً صادقاً 
للاهداف | alai‏ لتعليمية الوجودة في | لخطة الدراسية. وفي تطوير Gaus 3 á‏ تجريبية لاختبار 
لاس ستخدامه في التقويم او اليحوث فان درجات المفحوصين الذين اشترکو! فى دراسة تحليل 
الفقرات غير مهمين بحد ذاتهم. ویمکن لطور الاختیار فى هذه الحالة حذف الفقرات التی 
تحوي خلل او قصورء لذلك فإنه ينصح بانتاج عدد آکبر من الفقرات اکبر مما نحتاج لكل 
هدف أو مجال محتوی وتجریبها ميدانياً للتأكد من توافر ase‏ كافي وملائم من الفقرات 
الجيدة للصيغة النهائية للاختبار والتوازنة بشکل مناسب للمحتوی. واخیراً أن كان العلم 
مهتماً بحفظ الاسئلة فى مصرف اسئلة فانه يمكن استخدام بیانات التحلیل لتحدید الفقرات 
الجاهرة لاست ستخدام الفوري. بالاضافة الى اس ستخدام هذه البیانات في مراجعة الفقرات_ 
الخاطثة التي يمكن التحقق منها بتجربة ميدانية ثانية. وقد بيّن كل من لانج ولیهمان ومیهرنز 
(Lange, lehmann , Mehrens, 1965)‏ أن اعداد فقرات جديدة يتطلب خمسة اضعاف الوقت 
اللازم طراجعة الفقرات التوافرة, لذا فان اهمال الفقرات التي تحوي قصور دون محاولة 
مراجعتها يعد اجراء غير فعال فیما لو احتاج باني الاختبار صیغ اختبارية تغطي الحتوی 
لقي lo E‏ 

دراسة الصدق التقاطعي : 

يكون الاختبار اكثر فعالية لهذه العينة اكثر مما هو لأي عينة اخرى من الفحوصین, وتم برهنة 
هذا من قبل کبورتون ( 1950 , (Curetom‏ الذي وصف تطویر اختیار إختار dio‏ الفقرات التى 
كان اداء الفئة ذات متوسط علامات GPA‏ أعلى من اداء الفئة منخفضة متوسط 
للمفحوصين جميعهم على الفقرات المختارة حسب معامل ارتباطها مع GPA‏ وكان معامل 
الارتباط -0.80 وبعد ذلك يفترة أدرك كيورتون ان فقرات الاختبار كانت على بطاقة في وعاء 
حالة ظهور الوجه للاعلى فى البطاقة. وكانت فرصة ظهور الوجه لاعلى أو اسفل متساوية في 
كل رمية. وبالاختیار العشوائی كان وجه البطاقات لأعلى في Gall‏ عالية GPA‏ اکثر مما هو 
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للفئة المتدنية, وهذه الفقرات هى التى احتفظ بها نثيجة تحليل الفقرات وعندما حسبت درجات 
مق ol Gall‏ فقط فان دوجات القموصی TEN‏ حستبت بن البیانات نقسها طون ان الاذاء 
كان اکثر ارتباطاً بمتوسط GPA‏ ومن الواضح ان مثل هذه العلاقة قد تختفي فیما لو آعیدت 
الدراسة عندما يتم رمي البطاقات ثانية. کذلك فإن الصدق التقاطعي مشابه لوضع الفقرات 
في محرك ورمیها ثانية لرؤية ما إذا أدت الفقرات وظيفتها ثانية بفعالية. ولاجراء دراسة صدق 
تقاطعي يستخدم مطور الاختبار الفقرات التي اختيرت من نتائج تحليل الفقرات فقط وتطبق 
هذه الفقرات على مجموعة ثانية مستقلة من المفحوصين وثبات و / of‏ صدق هذه الدرجات 
suas‏ باستخدام الطرائق الوصوفة في الفصلين السابع والعاشر على التوالي. 

ويسبب الجهد البذول في تطبيق الاختبار فمن الشائع في دراسة Jalas‏ الفقرات/ الصدق 
التقاطعي جمع بیانات كلا الحالتین في جلسة اختبارية واحدة. ويتم هذا بتطبيق الفقرات 
. جمیعها في اللف الاختباري على الفحوصین جميعهم. ويؤشر الى كل ورقة اختبارية عشوائياً 
Le‏ الى تحلیل الفقرات أو الى دراسة الصدق التقاطعي؛ فعلی سبیل JAU‏ لو اختبر 400 
(PST‏ في30 فقرة» تقسم اوراق الاجابة الى مجموعتین کل منهما تتألف من 200 ورقة 
ويعدها يستخدم مطور الاختبار احدى المجموعتين في تحليل الفقرات. وعلى اساس هذا 
التحليل افترض ان 20 فقرة اختيرت فى الصيغة النهائية للاختبار وفي الجموعة الثانية 
اللفة من 200 ورقة تستخدم 20 فقرة فقط في دراسة الصدق التقاطعي في حساب الثبات 
EET‏ تفن الان زرف سین REN‏ درا ها ااا الحم انم 
مشابهة بغض النظر عن اي المجموعتين استخدمت في تحليل الفقرات أى الصدق التقاطعي, 
ويمكن pal‏ هذا پاشتخدام العينة 1 في تطيل الفقراك. والغينة 2 في tabi‏ الصدق ثم 
Sule!‏ الدراسة باستخدام العينة 2 في تحليل الفقرات وعينة 1 في دراسة الصدق التقاطعي, 
وهذا ما یعرف ب الصدق التقاطعي الضاعف : ۱ 


ومن الواضح ان الحاجة للصدق التقاطعي يعني ان عدد أكبر من الفحوصین يجب توافره 
عما یلزم لتحليل الفقرات. احد الاسئلة التي تظهر احياناً في تحلیل الفقرة / الصدق 
التقاطعي یتعلق بنسبة المفحوصين اللازم لکلا العینتین, مع ان التجزئة 50:50 الستخدمة في 
المثال السابق شائعةء ففي حالات اخرى تکون التقسیمات اکثر منطقية. فإن كان اللف 
الاختباري مثلاً مؤلف من 50 فقرة وتوافر 400 مفحوص فقط فانه یفضل استخدام نسبة 
اکبر من الجموعة في تحليل الفقرات ونسبة آقل في الصدق التقاطعي وهنا یستخدم على 
الاقل 250 مفحوص في تحلیل الفقرات و 150 في الصدق التقاطعي (لوحظ ان هذه التجزئة 
حددت بوساطة القامدة: 5 مفحوصین على الاقل لكل فقرة في تحلیل الفقرات) 
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تحليل الفقرات في الا ختبارات المحكية 

الهدف الشائع للاختبارات المحكية هو تقييم الاداء على مجموعة مهام ممثة لمجال محدد 
تماماًء لذلك فان مطوروا الاختبارات المحكية يستخدمون بثبات بعض التقنيات لدعم صدق 
المحتوى للفقرات من خلال احكام الخبراء التي نوقشت في الفصل 10 لذا فإن فحص بيانات 
الاستجابات التجريبية تكون مفيدة في تطوير الاختبارات المحكية وفي فحص بيانات الاجابة 
على الاختبار فإن مطور الاختبار نادراً ما ينظر الى الفقرات التي تتضمن قصور فقط ويدلاً 
من ذلك فإن العملية التدريسية ASH‏ وخطة تطوير الاختبارء والفقرات تكون خاضعة للتدقيق, 
فعندما لا یکون اداء الفحوصین كما هو متوقم على فقرة معيئة فان الفشل قد يكون لعدم 
ملاكمة الف رسن او Uta) Gates‏ اق الاهدافب ای تركيب الققرة. ومدق تحليل الققرات 
فى الاختبارات محكية المرجع هو التحقق من العوامل الدخيلة لنطاق معين تعزى الى الاداء 
SSN ol aa, fe‏ لهذا السب قات i‏ انیم باففیارات ER‏ أكناروا الى ام 
احضائیات الفقرة لا يهن ان تكن دالة لتباین درجة الفقرة لجموعة وني واحدة انظر: 
(Millman & popham ,1974 , popham & Husek 1969)‏ لذا فان معاملات تمييز الفقرة 
الوصوفة فى الاجزاء السابقة من القصل لا تناسب الاختبارات المحكية كما هو الحال 
tana‏ رات الحا GU‏ يكب لا تخایل الفقرات LS‏ اك ان رمن شنت Say)‏ 
بوضوح وعلی وجه الخصوص يجب ان یعرف مطور الاختبار ناذا یحتاج الى معلومات عن 
استجابات الفقرة وكيفية استخدامها, وفی مواقف معينة فان واحداً gh‏ اکثر.من هذه الاسفلة 
تكون مناسبة. l‏ 

1 ما مستوی صعوية الفقرات؟ 

2 هل الفقرة حساسة التدریس؟ مثل هل تميز بين الذي درس والذي لم یدرس؟ 

3/ هل هنالك اتفاق عبر انماط الاستجابة لفقرات معينة» كما هو مفترض من مواصفات 

الاختبار؟ ۱ ۱ 

اقترح العدید من الاحصائیات للاجابة عن هذه الاسئلة. واحد أو اکثر من هذه الطرائق 
معروض هنا. وهذه الطرائق العروضة اختیرت لعمومية تطبیقاتها (قابلیتها للتطبیق على 
العموم وسهولة حسابها, وتفسیرها واضح غير غامض, والقارىء الهتم بتفاصیل اکثر لهذه 
الطرائق وغیرها من طرق تحلیل فقرات الاختبارات المحكية عليه الرجوع الى 
(Berk , 1980 b Harris , Pearlman & Wilcox1977 Harris, alkin, & popham 1974, & Lord ,1980)‏ 














صعوية الفقرات: 

يعرف مستوى صعوية الفقرة في الاختبارات المحكية عموماً على أنها نسبة المفحوصين 
الذین آجایوا إجابة صحيحة على الفقرة P)‏ (. 

والناقشة السايقة لهذا الفهوم مناسبة عدا ان مطور الاختبار Soll‏ لا يهتم باختیار 
الفقرات التي تعظم التباین. مع ذلك OR‏ فحص صعوية الفقرة یبقی Loge‏ فمن النطق تحدید 
متوسط أو وسيط مستوی صعوية کل مجموعة من الفقرات التي تقیس هدف معین. وتفید هذه 
القيمة فى تقييم فاعلية التدریس للهدف او ملائمة الواصفات للفقرة. على سبیل الثال: 
الفقرات السهلة las‏ في الاختبار القبلى تجعل مطور الاختبار يتساءل عما اذا كان التدريس ` 
لهذا المحتوى ضروري of‏ فيه اسهاب لهذه الفئّة من المفحوصينء بينما الفقرات متطرفة 
الصعوية لمجموعة يعد التدريس قد تشير الى ان التدريس كان غير فاعل آو ان المواصفات 
تكسن مخ Dales ol‏ غیر مقطاة بالأقداف التتليهنة والفقرة الواحنه السهلة جدا oh‏ 
الصعية جداً بالتسبة للفقرات الاخری المتعلقة بالهدف نفسه يجب فحصها من حيث الخلل او 
القصور التقني او أي مؤشرات غير مقصودة او الخطاء مفتاحية, أى غموض فى الكلمات التي 
تقيس هدف Camo‏ معلومات مفیدة» فعندما تكون مستويات صعوية هذه الفقرات متنوعة faa‏ 
الفقرة على الترتیب . 
حساسیه التدريس: 

يعد مقیاس حساسية التدریس للفقرة بالاساس مقياساً لجودة تمييز الفقرة بين 
الملفحوصين الذین حصلوا! على التدریس ومن لم يدرسوا. واقترح کوکس وفارجاس 
(Cox& vargas 1966)‏ طريقة يتم فيها اختبار المجموعة قبل التدريس coders‏ ويحدد احصائى 
التمييز على النحى الآتي: ش 

< و یعد JP-‏ دم و۰۰۰۰ (4-14) 

حيث ترمز ‏ بعد الى نسبة الذين اجابوا اجابة صحيحة على الفقرة في الاختبار البعدي 
و۴ قبل الى النسبة نفسها في الاختبار القبلي. 
درينان )1972 Brenan,‏ طريقة تتطلب درجة abd‏ السيطرة : 
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Casas es: (ng/L - n/U ) = B 


حيث يرمز my‏ الى عدد الذين حصلوا على درجة أعلى من درجة القطع و 22 أقل منهاء و 
ا الى عدد الذين درجاتهم أعلى من Lays‏ القطع واجاباتهم على الفقرة صحيحة: وبآ إلى 
عدد الذين درجاتهم دون درجة القطع وإجابتهم صحيحة. ولان 8 هي الفرق بين النسبتين 
فإنها تتراوح بين -0.1 و+ 1 مع تفضيل القيم الوجبة العاليةء وملاحظة ان 8 مقياس لقدرة 
الفقرة على التمييز عند نقطة قطع معينة. 

وعندما يريد مطور الاختبار تحديد اي الفقرات اكثرفاعلية نسبية او أقل في التمييز بين 
مجدوهاه الاو Gad‏ الاو ك شوه ام تس عرائق إرخاطية hd‏ امار ميزه 
(Berk ,1980(‏ استخدام طريقة ارتباطية اشتقها ساوب (1966, .(Saupe‏ في اختيار الفقرات 
والأدوات المصممة لقياس التغير. ويتطلب استخدام هذه الصيفة تطبيق كل فقرة على 
المجموعة نفسها في تصميم اختبار قبلي- اختبار بعدي. ويحسب لكل مفحوص درجة التغير 
للفقرة وتكون (1» أو صفرء أو -1) على التوالي» مشيراً الى كسب 1 نقطةء اولا كسبء او 
خسارة نقطة علی التوالی. بالاضافة الی حساب درجات الفحوصین TSW‏ علی الاختبارین 
القبلي والبعدي وکذلك درجة التغیر الكلي: 

(16-14) ۰ رید = ۷ سس‎ D 

حيث ترمز ل الدرجة الكلية على الاختبار البعدي, و × الى الدرجة الكلية على الاختبار 
القبليء ولكل فقرة حساب معامل ارتباط بيرسون بين درجة التغير للفقرة ودرجة التغير الكلية, 
واقترح ساوب )1966 Saupe‏ صيغة حسابية بديلة لهذا الارتباط يؤدي الى نتائج مشابهة لمعامل 
ارتباط بيرسون بين درجة التغير على الفقرة ودرجة التغير الكلية ٠.‏ 

ووصف ميلمان (1974, (Millman‏ طريقتان غير السابقة لتقييم حساسية التدريس يستخدم 
فيها مطوّر الاختبار بيانات استجابات الفقرات لمجموعتين منفصلتين احداهمامفحوصين تم 
تدريسهم والاخرى لم تدرس» ومن خلال معامل الارتباط الجزئي او الانحدار التدرج فإن كلا 
الطريقتين تسمح لطور الاختبار ليبدأ بمجموعة فرعية صغيرة في الفقرات وتقييم تحسين 
الاختبار لحساسية التدریس مم اضافة كل فقرة المجموعة . 

ويجب ملاحظة ان اختیار (آوحتی مراجعة) الفقرات على اساس معاملات حساسية 
التعليم قد تتضارب مع هدف الاختبار المحكي الذي طور في الاصل. فان كان GAM‏ الاصلي 
لفق اه نوكل اه و و ها يهن ان شرف توس کا ات 








PED من مجموعة قرطب طاق الى‎ E للقدريان تب‎ alias 
درس بفاعلیة) » افترض على سبیل الثال أنه ولهدف واحد مهم لم يكن هناك تدریس‎ 
(Cox & (D) ولم یظهر تعلسم. فإذا كانت الفقرات الختارة على اساس قیم عالية ل‎ 
فان فقرات هذا الهدف جمیعها يجب حذفها من‎ (Brenan ,1972( B si Vargas,1966) 
الاختبار. ومن الواضح أن حذف هذه الفقرات لا يحسن صدق المتوی للاختبار محكي‎ 
فضلاً عن أن طريقة مثل طريقة ساوب لتغیر درجة الفقرة صممت بالفعل للقیاس‎ aul 
معياري ارچ ومثل هذا العامل ينتج عنه اختیار فقرات لها تباین في درجات التغیر والذي‎ 
لیس هدفاً تا لمطور الاختبار الحكي الرجم لذا فليس من النطق حساب معاملات‎ 
لكل اختبار محكي ومن الهم الناداة لاستخدام مثل هذه العلومات‎ taka حساسية التدريس‎ 
والتمييز بان اختیار الفقرات على أساس مثل هذه المحكات الاحصائية لا تتطابق مع أساليب‎ 
السيطرة على النطاق في القياس. وقد تزودنا معاملات حساسية التدريس بمعلومات مفيدة‎ 
حول نوع المحتوى الذي تم تدريسه بفعالية او بدون فعالية في برنامج تدريسي معين.‎ 
واستخدام بيانات تحليل الفقرات بهذه الطريقة شد رسن ينا ان مستخدم الاختباريضع ثقته‎ 
في نوعية الفقرات.‎ 
: معاملات الموافقة‎ 
في العديد من الحالات يكون اهتمام مطوّر الاختبار في دراسة تشابه استجابات مجموعة‎ 
في‎ Lasts واحدة من المفحوصين لكل زوج من الفقرات کتبت بالخصائص نفسها. يبدو هذا‎ 
الواقف التي يتم فيها تطوير اختبارات متتابعة من خلال تطوير الفقرات عشوائياً بوساطة‎ 
مجموعة فقرات اختبرت ميدانيا. وهنا يريد مطور للد و إذا كان نالامکان‎ 
افتراض التبادلية لهذه الفقراتء ويمكن في هذه الصالة ترتيب بيانات کل‎ 
كل مو ها ریس‎ eam, GC a Al وو مح ار اتقو عفرل‎ 
هذه‎ fio معاملات احصائية متنوعة يمكن تطبیقها على‎ (Marris&perriman 1977 ( وسركان‎ 
البیانات» ويعتمد الاختبار الاحصائي المناسب على ماذا يريد مطور الاختبار ان يعرف فيجب‎ 
وف كلمن فان واا اليل‎ Aan اا التو‎ lis LAS أن مطرع سین‎ 
من المعاملات التي يمكن استخدامها لتوضیح اسلوب تحلیل الفقرات هذا. ووصف ویلکوکس‎ 
تعقيد ا لانها‎ AS] احتمالية اضافية لاختبار تکافق الفقراتء وهذه النماذج‎ gala (Wilcox) 
أن الفحوص قد‎ yay) تاخذ بحن الاعتبار احتماليةالاستجابات غیر الناسبة من الفحوصین‎ 
هذه‎ fies یعرف الاجابة ولکنه قدم اجابة خاطنة أو العکس) والطرائق الوصوفة هنا لا تسمح‎ 
الامكانية.‎ 
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وكمثال ابتدائي» افترض ان مطور الاختبار يريد معرفة " ما إذا كانت فقرتين تقيسان 
ا ی Cc)‏ 
(a+c) (b+d) (d+c) (b+a)‏ 
حيث ترمز: 2 الى عدد افراد العينة و ,8,2 ,© , 4 هي تکرارات الخلايا في الجدول (14- 
5( وهذا الحساب موضح في جدول )6-14( واحصائی 02 المحسوب يقارن بقيمة Sic IC?‏ 


. حرية 1 ومستوى الفا المرغوب‎ days 


جدول (5-14): جدول رباعي الخلايا يمثل استجابات على ازواج الفقرات 


الفقرة 1 
+ - 


الفقرة . - 





الفقرة 1 
+ 


-  ةرقفلا‎ 














حدول (6-14): تطبيقات توضيحية لمعاملات الموافقة والارتباط لديانات فقرات حدول (14 - 5 ب). 


لذلك Te‏ الامتمابية لاستجابات هاتین 


و ا ا 0 ar‏ رت دما پم ان SoA‏ 
| تقيشيان المهارة إو ٍْ 





فان كانت القيمة المحسوية للاختبار الاحصائي دالة (كما وجد فى مثالنا) فان الاستجابات 
على الفقرتین نقول انها معتمدة gf‏ مرتبطة. والفشل بایجاد ارتباط دال cps‏ الاستجایات علی 
فقرتين مكتويتين من خصائص الفقرات نفسهاء تطرح سؤالاً حول ملائمة الواصفات نفسها 
آو التتقية etal duc gill‏ الفقرتین الستخدمتن او کلاهما 

عند ايجاد تشابه في استجابات الفحوصین اکثر مما هو متوقع بالصدفة, فقد يرغب 
مطور الاختبار بعدها حساب احصائی یصف dans‏ التشانه. امن الاحصائیات والقابل 
للتفسیر الفوري هو ببساطة تسبة الاق 2 +0 inf‏ وقوه إغبارة عق Laut‏ الفحوصن E‏ 
اجاباتهم متسقة على الفقرتین انظر جدول )6-14( للحساب التوضيحي والتفسیر لهذا 
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وتفسيره معنويأعبر أزواج فقرات عديدة ولانه تقدير غير متحيز. واحصائيات اخرى ملائمة 


ومعامل © ليول الذي اوصی به هاريس وبیرلان او معامل فاي» وسؤال مختلف قليلاً هو ما 
غذا كانت صعويات فقرتين متساوية في مجتمع المفحوصين أعد صياغة السؤال بطريقة 
اخری: ۱ 

هل الفروق اللاحظة في الصعوبة صغيرة لدرجة یمکن ان تعزی الى خطأ المعاينة ومثل 
هذا السال یکون مناسباً فیما لو افترض مطور الاختبار ان البرنامع التعليمي وسحتوی 
الفترتین تم تعلیمها بالتساوي» ویرغب مطور الاختبار التحقق من هذا الغرض واقترح هاریس 


3 


Glass‏ لمثل هذه الحالة احصائي مريع كاي» ويالصيغة: 


21-1 
)8-14( 000 q..... (1-IC-b1) _ y2 
C+b 


وثانيةء يقارن هذا الا حصائي المحسوب بقيمة مريع كاي عند درجة حرية 1 ومستوى الفا 
الرغوب. وتشير القيمة الدالة لهذا الاحصائي الى ان الفرق في صعويات الفقرتين لعينة 
المفخوصين اكبر مما يعزي للصدفة (انظر جدول 14 - 6) للحساب المطبق على الفقرتين في 
المثال) . 

بشكل le‏ قد تكون مناسبة Losie‏ تظهر اسئلة محددة حول كيفية اداء المتعلمين على زوج 
معين من الفقرات. وتتطلب الاسئلة المختلفة معاملات احصائية مختلفة» ومن غير المرغوب به 
تطبيق واحد أو اكثر من هذه المعاملات للازواج المحتملة من الفقرات جميعها في اختبار كبير 
وتؤدي الى معلومات مهمة. فلمجموعات الفقرات الصغيرة (مثل فقرات كتبت من الخصائص 
نفسها او المطابقة للهدف نفسه في دراسة صدق المحتوى). فقد تزودنا معلومات الاتفاق بأدلة 
تجريبية تدعم الحكم المنطقي لتشابه الفقرات وفي بعض الاختبارات المحكية تدون اداءات 
الفحوصنن منفصلة لعدد من الاهداف المختلفة gf‏ مجالات المهارات ويعدد قليل من الفقرات 
پقیس كل هدف, وفي مثل هذه الحالات یبدو آن التصقق من درجة GLO‏ في الاداء على 
الفقرات ضمن هدف یقیس مهارة مؤكدة يلزم لدعم تفسیر الدرجات. 
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ملاحظة اخيرة» وتطبق على طرائق تحليل الفقراث المحكية جميعهاء لاحظ كل من هاريس 
(Harris , 1974)‏ وهاریس ویسرشان وویلکوکس (1977 , (harris , Pearlman & Wilcox‏ أخذوا 
موقف في حالة اختيار الفقرات عشوائياً من ملف اختباري لتمثيل نطاق محتوى اختير بعناية, 
فلا يجب حذف اي فقرة بالاعتماد على تحليل الفقرات. فقد اکدوا على ان المراجعة بعناية 
للفقرات اثناء مرحلة بناء الاختبار والمناداة بخطة تطوير الاختبار تكون كافية للحصول على 
درجات اختبار صادقة. ويكون دور بيانات تحليل الفقرات التزويد بمعلومات حول ما إذ! كان 
النظام التدريسي آو خطة تطوير الاختبار فاشلة. وتتضمن وجهة النظر هذه أن على كتبة 
الفقرات لاختبار ما تجنب انتاج فقرات فيها قصور أو استخلاص استدلالات عن المفحوصين 
من الفقرات السيئة . وانتقد هذا الموقف من قبل ميسك )1975 (Messick,‏ وأدى الى طرح سؤال 
من قبل بیترسون (1979, (Petersen‏ حول منطقية الاعتمادعلی dire‏ من الفقرات في بذاء 
الاختبار عندما يكون الهدف الاستدلال عن الاداء على نطاق فقرات اكبرء لذا يجب أن يكون 
مستخدم الاختبار مدركا بان الطرائق التي تستخدم فيها بيانات تحليل الفقرات يعتمد على 
وجهات نظر ald‏ مخقفة حول بتاء الاختبار وتفسیر درجاته. 
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a ۱ a |‏ مع ذلك فان ور وا الاختبازات محكية الرنجع قد يهتموا بم 
f‏ و وحساسية الفقرة للتعليم ودرجة الاتفاق. دين ازیاج معينة نب 
on |‏ 1 ق احصائية م معنية it‏ إدبيات gaal ol‏ هذه الأ 





التمارين: 
1/ استخدم بيانات الفقرتين الاتيتين لعشرة مفحوصين في الإجابة على الاسئلة التي تلي: 





Hiya Sl Natl شمه‎ lag + 50/50 Uae ملح‎ A Gaal السو‎ Sats لك ما‎ 
للفئتين العليا والدنيا؟‎ 7 
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ب- ما pad‏ معاملات بوینت بایسیریال م Scat fall Sly!‏ 

ج- ما قیم معاملات بوینت بایسیریال التقطي ‏ لهاتین الفقرتین؟ 

د- كيف تختلف الافتراضات التضمنة في معاملات بایسیریال و بوینت بایسیریال؟ 
قشع سای سل اه الآتية واجب عن الاسئلة التي تلي: 





[- أي الفقرات يبدو آنها الاکثر حاجة المراجعة؟ 

ب- للفقرتين 21 و 25 معاملات صعوية متساوية تقريباًء ومع ذلك فانها تختلف في 
تمييزهاء فكيف يمكن تفسير هذا؟ 

ج- إذا أردت تحسين الفقرة 21 ASS‏ تحاول ذلك؟ 

قترح على الأقل فرضيتيين معقولتين لتفسر التمييز السلبي للفقرة 23؟ 

ه- احسب قيم معامل ارتباط بايسيريال بين الفقرة والدرجة الكلية للفقرتين S25 2A‏ 

وحم أل كمي bis Na‏ بویت Ils‏ ادا leah}‏ الاختیای ان poss‏ مساكدا 
بنسبة %95 gl‏ هذا الاحصائي أكبر من صفر ويدلالة؟ 

ز- افترض نموذج تخمین عشوائي» ما مستوی الصعوية الثالي لهذه الفقرات إذا رغب 
مطور الاختبار تعظیم ثبات درجات الاختبار؟ 

3. افترض أن الفقرتين (21 و 22) في المثال السابق أعدت على وفق مواصفات الفقرات 
نفسها وكان توزيع الاستجابات الثنائي لهما على النحو الآتي: 
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-  ةرقفلا‎ 
22 





اما A et aa tal‏ سکن GBA)‏ کیان درسي أن القشی وی وم 
تقیسان الهارة أو العرفة نفسها ٩‏ 

بت ما الطريقة الححضافیا AN‏ ینکن plea Galen‏ فرضیه ان الفقره )22( $s‏ 
tages‏ من الققرة (2:1)؟ لمری الحسابات oi‏ استتتا مان 

عدا هر كف Blea aa‏ ف رين )79( لب إلى balan‏ فا اوهل أن مين 
المعاملين يزودان بالمعلومات نفسها؟ 
ليبين استجابتك: 
1. معامل فاي بين درجات الفقرة. 
2. معامل ارتباط بوينت بايسيريال بين الفقرة والدرجة الكلية. 
3. ارتباط بوينت بايسيريال بين الفقرة ودرجة محك خارجي. 
4 ارتباط بیرسون cas‏ الفقرة والدرجة الكلية. 
S‏ ارتباط بیرسون بين الفقرة والدرجة على محك خارجي. 

آ- مررشد في مرکز ارشادي بكلية یرغب في اختیار الفقرات الصادقة في مقیاس اتجاهات 
زیخ cs‏ ين راي )ركان Li Ace‏ مم aaa cotati ola‏ 
على آنهم أعضاء أو غير اعضاء). 
لفقرات بتدریج ثنائي )1( الاجابة نعم و (0) للاجاية لا: 

رش اة باس اة ا اباق الذاخك SER‏ وده موی من [ 30 مقر يق 
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نوع الاختیار من متعدد وزاريعة بدائل لکل فقرة 7 واعطیت نقطة واحدة لكل فقرة 


ETE 
+ الفقرات پاعمارهم.‎ 


ه- طوّر alle‏ نفس قائمة لتقییم الاحکام العرقية وصححت کل فقرة على تدریج Alpe‏ من 
)5( نقاط وتم اعدادها من خلال فساهمات خاصة على اعضاء مقطع عرضي واسع 
dota‏ الوقت) ویمکن استخد امه کمحك. 

5 - اشتق صيغة لعامل ارتباط بوينت بايسيريال ابتداءاً من صيغة معامل ارتباط 
بيرسون: 

X- wy) (y-y)‏ رز 
oe Nox Oy‏ 
حيث × تمثل متغير ثنائى بأخذ الدرجتين )51 2( 
ب - فى ضوء هذا الاشتقاق. فسر JU‏ تكون قيمة معامل يوينت بیسیریال = 1 نادرة 
الحدوث. 
6ر أشار بعض المؤلفين أنه من أجل أن يكون للدرجات على أي مقياس مؤشر لصدق 
المحتوى أو البناء يجب أن تتوافر مؤشرات بأن كل فقرة ترتبط بالدرجة الكلية للاختبارء 
وحيث أن ارتباط درجة الفقرة بالدرجة الكلية ترتبط ارتباطاً مباشراً بالاتساق الداخلي, 
فما الأساس النطقی لموقف المؤلفين هذا؟ 

7/ صمم طالب دراسات عليا اطروحته التي تتطلب قياس اتجاهات الامهات نحو المواليد 
ever‏ 

وطرحت الكلية من خلال طاقم مشرفین آريعة مقترحات متفصلةء وعلی النحو الاتي: 

1. استخدام آول )15( حالة في تحلیل الفقرات ثم تنقية الاداة واستخدام الحالات 
الخمسة عشر الأخرى في الدراسة تفسها. 











2- استخدم aby‏ دون أي تحلیل للفقرات. وافترض آن هنالك فرصة للحصول على 
معلومات جيدة. 


3- طبق الفقرات جمیعها علی الأفراد Laren‏ وأجری تحلیل فقرات واحذف الفقرات 
السيئة ثم آعد تصحیح الاداة للأفراد آنفسهم باستخدام الفقرات الجيدة فقط. 


ناقش مزایا ومساويء کل مقترح وقرر آیها أفضل. 

8/ افترض أن مطور الاختبار اعتبر أن انتاج اختبار فرعی تالف من )15( فقرة التي 
عرضت بيانات تحليل فقراتها في جدول )4-14( . احسب التباين التقريبي lids‏ 
الدرجات على هذا الاختبار الفرعي. 
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الفصل الخامس عشر 
مدخل الى نظرية الاستجابة للفقرة 
أشرنا فى الفصل السابق إلى أن اختيار الفقرة يعتمد على معاملي الصعوبة والتمییز, 
وتعمل هذه بفاعلية في مواقف عدة في بناء الاختبارات. إلا أن تطوير الاختبار يتطلب معلومات 
إضافية عن الاستجابات للفقرة. افترض الفقرتين الاتيتين مع نماذج الاستجابة الخاصة بها 
وعلی النحو الاتي: 
1 اجاب علی الفقرة Loge UL (i)‏ کل من سل على رجا 50 او اكش في 
الاختبار, وأجاب علیها بشکل خاطئ جمیع الفحوصین الذین حصلوا على درجة أقل 
من 50. 
2. آجاب على الفقرة (ب) إجابة صحيحة 20 0 من الذین حصلوا على درجة AS‏ و 
0 من الذین حصلوا على الدرجة 50 و9660 من الذین حصلوا على الدرجة 55 
و 80 © من الذین حصلوا على الدرجة 60 والفحوصین جمیعهم الذین حصلوا على 
الدرجة )65( فما فوق. i‏ 
من الواضح وجود اختلافات في أنماط الاستجابة الملاحظة لكلا الفقرتين» ومن الضروري 
لطوّر الاختبار أن يعرف هذاء ولا يوفر التحليل الاحصائي التقليدي للفقرة معلومات عن LAS‏ 
الأداء على الفقرة من قبل مفحوصين بمستويات قدرة مختلفة للسمةء واحدى طرائق تطوير 
الاختبار التي تؤدي إلى صورة أكثر اكتمالاً لوظيفة الفقرة تُعرف باسم نظرية الاستجابة 
فقرة أونظرية الستمة الکامنة. 
وفي نظرية السمة الكامنة یفترض مطوّر الاختبار أن الاستجابة على فقرات الاختبار تعزی 
إلى سمات کامنة تکون في عددها آقل من عدد ققرات الاختبار» وعلی العکس فآن معظم 
تطبیقات النظرية تفترض وجود سمة کامنة واحدة تفسر الاستجابة على فقرأت الاختبار» cody‏ 
صمیم النظرية نمولاج رياضي یبین UES‏ اسقجابة مفحوصیح من مستویات مخظفة القدرة 
على الفقرات. وهذه العرفة تسمح بمقارنة آداء الفحوصین الذي یتقدمون لاختبارات مختلفة» 


الجموعة التي حللت الفقرات من خلال بياناتهاء ومن الطبيعي أن مثل هذه الامکانات لها 
3 طبيقات سيتم وصفها في هذا الفصل وفي الفصل الحشرين: ومن الصادر الهمة للتطییقات 





العملية للنظرية: 
(Hambelton, 1983) , (Hambelton & Swaminathan 1985) , (Traub & Wolfe,‏ 
Lord, (1980), (Drasgow & parsons, 1983).‏ , )1981 


E Akal AE الفافكم‎ a al ha ةا‎ gees 

فا مها وقد موش تک هر eat‏ الموات الدغا ريعس Syst)‏ العلاقة بين alles‏ 
نظرية الاستجابة للفقرة ومعالم النظرية التقليدية. کذلك تم عرض العدید من تطبیقات النظرية 
وتحدیداً يجب على القاری استیعاب القصود بکل من: 

BEA‏ ی Taste‏ العامة 

2. مم یتالف النحنی المميز للفقرة. 

3. ما هو فرض الاستقلال الحلي وكيفية ارتباطه بابعاد الاختبار. 

وهذه المفاهيم الثلاثة أساسية فى نظرية الاستجاية للفقرة (السمة الكامنة)ء وسیتم وصفها 
فى الأجزاء التالية. 


المفاهيم الأساسية في نظرية الاستجابة للفقرة: 
السمات الكامنة والمنحنيات المميزة للفقرة ‏ 

أحد المفاهيم المركزية لنظرية الاستجابة للفقرة هو النحنی المميز للفقرة (Item‏ 
characteristic Curve ICC)‏ ويمثل احتمالية الاستجابة الصحيحة على الفقرة كدالة للسمة 
الكامنة (ويرمز لها بالرمز (O‏ القاسة في فقرات الاختبار (وفي الجزء التالي سنبين بدقة آکثر 
ماذا نقصد عندما نقول السمة الكامئة المتضمنة في الأدأء على فقرات «(LIAM‏ فقي معظم 
تطبيقات نظرية الاستجابة للفقرة نفترض أن النحنی المميز للفقرة له الشكل 5 كما هو tase‏ 
فى الشکل (1-15) ویبین النحنی آنه بزيادة قيمة السمة الكامنة تزداد احتمالية الأسحجاية 
اسح عل الفقرة فسن علج رت السعة درخة الكامنة: 
لورد )1980 (Lord,‏ تفسیرین مقبولین لهذه الاحتمالية, فللتفسير الأول مجحب تسمية مجموعة 
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فرعية من المفحوصين عند كل نقطة على تدريج السمة الكامنةء والخصائص المحددة لكل 
مجموعة فرعية هي الافراد الذين لديهم درجة السمة الكامنة نفسها (وفى الجزء المتيقى من " 
هذا الفصل فإن آفراد الجموعة الفرعية ستطاق علیهم اسم الجموعة الفرعية التجانسة). 
وتفسر احتمالية الاجابة الصحيحة عندئذ على آنها احتمالية الاجابة الصحیحة لفحوص 
اختیر عشوائياً من الجموعة الفرعية التجانسة. اقترض أن النحنی المیز للفقرة يشير إلى 
أنه عندما تکون 0 =2 فان احتمالية الاجابة الصحيحة على الفقرة تکون (0.87)» ویفسر هذا 
ليعني أن احتمالية الاجابة الصحيمة لفحوص اختیر عشوائياً من الجموعة الفرعية 
التجانسة يساوي )0.87( ویشیر التفسیر الثاني إلى الجموعة الفرعية من الفقرات التی لها 
النحنی المیز للفقرة نفسه. وتفسر احتمالية الاجابة الصحيحة عندئذ على Lel‏ احتمالية 
استجابة مفحوص معين على فقرة اختیرت عشوائیاً من مجموعة الفقرات الفرعية. وأوصی 
لورد )1980( بالتحدید تجنب تفسیر احتمالية الاجابة الصحيحة باحتمالية اجابة مفحوص 
معين على فقرة محددة إجابة صحيحةء وسنستخدم في الکتاب التفسیر الأول لتجنب التداخل 
عبر التفسیرات الثلاث. وسنبحث النحنی المیز للفقرة على أنه تمثیل بياني لنسبة الفحوصین 
الذين آجابتهم صحيحة على الفقرة وعلی آنها دالة لدرجة السمة الكامنة. " 


sali _ 1.00‏ 
اجاباتهم حميمة 
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السمة الكامنة (8) 


شكل (1-15) العلاقة بين القدرة والاستجابة على الفقرة 
ومع ذلك فإن الشكل 5 للمنحنى المميز للفقرة يستخدم بشكل واسع الانتشار في بناء 
الاختبارات. وهو ليس الشكل الوحيد المحتمل للمنحنى المميز للفقرة. وسنبحث في المناقشة 
الحالية منحنیات fle‏ تلك التي تظهر في الشكل (۰)2-15 ويطلق على (fis‏ هذه المنحنيات أسم 











دالة الخطوة e (Step function)‏ ويتضمن هذا المنحنى وجود درجة سمة كامنة دنيا يرمز لها 
بالرمز )82( وعند درجة اقل منها لا يستطيع الفحوص الإجابة بشكل صحيع على الفقرة, 
وتفيد دوال الخطوة هذه في إنتاج مفاهیم Lage‏ غديدة لنظرية الاستجابة للفقرة. ومع ذلك تعد 
ذال ee‏ اله Saal‏ الق اقل يوا ف gaol LE tay‏ متا الط وذلك 
لأن بيانات الاختبار الحقيقية تكون AST‏ اتساقاً في حالة المنحنى ذو الشكل 5. 


1.0 


الین ام انات ` 
0.50 


R bee NAN A ate; 4 s > 
۱ ` 0.00 





60 
0 i 3 5 
5 \peg -Y 


السمة الكامنة (8) 
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شكل )2-15( : دالة الخطوة للمنحني المميز للفقرة ‏ 7" ١‏ تیم 


أحادية البعد والاستقلال المحلي: 

في نظرية القیاس تدرس E‏ متغیرین من خلال الارتباط بینهماء ومن الألوف ذه 
نظرية الاستجابة للفقرة استخدام مفاهیم AST‏ عمومية للاستقلال الاحصائی gf‏ عدمه عند 
الحدیث عن العلاقة بين التغیرات» ويمكن تحدید الفاهیم للفقرات ثنائية التدرج على gall‏ 
الاتي: 

لتکن )+( Pi‏ ترمز إلى احتمالية الإجابة الصحيحة على الفقرة G)‏ و BC)‏ ترمز إلى 
احتمالية الاجابة الخاطئة على الفقرة (i)‏ وکذلك )+( Bj‏ و (-) Pj‏ ترمز إلى الاحتمالات 
المناظرة الفقرة -G)‏ ولترمز (Pt)‏ و PEA)‏ و (-, )۲ إلى احتمالات نماذج الاجابة البينة 
في الاقواس, فعلی سبیل الثال ترمز (+,+) P‏ إلى احتمالية الإجابة الصحيصة على الفقرتین 
j i‏ على التوالي. وباستخدام هذه الرموز فإن الفقرتین تکونان مستقلتین احصائياً إذا کان: 
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(1-1-15) ©)رط. )بم‎ = P(+,+) 


3 

Pi )( ۰8: )( = P(+,-)‏ (1-15-ب) 
3 ۱ 

P(-,4)‏ = )( :۰2 () يم (1-15-ج) 
و 

(3-1-15) PC) EEO) = P(-,-) 


وتكون الفقرات غير مستقلة احصائياً في حالة عدم تحقق احدى معادلات )1-15( فعلى 
سبيل JEU‏ إذا كانت (+):۳ 0.8 و (۳ 0.2و )+( رطع 0.6 و () :۰04-۳ فان 
استقلال الفقرتین یتحقق إذا کان: 

048 =P (+ ,+) 

0.33=P(+,-) 

0.12 5) ,+) 

0.8 5=P(-,-) 

بمعنی AT‏ تبین الضروط فى العادلة (1-15) أن الفقرات تکون مستقلة عندما یمکننا 
حساب احتمالية أى نمط استجابة لکلا الفقرتین من معرفة احتمالية الاستجابة الصحيحة 
والخاطئة فقط ولکل فقرة. 

وتتحدد احادية البعد من خلال الاعتماد الاحصائی عبر col Ball‏ وتحديداً فإن متطلبات 
احادية البعد للاختبار تعنی أن الاعتماد الاحصائی عبر الفقرات یعزی إلى سمة واحدة فقط 
وهذا يعني أن الاختبار احادي البعد إذا كانت الاختبارات احصائياً في المجتمع الكلي تقیس 
مه كامتة abe‏ ققد ويل هت el alll‏ كرون سس اانا لكل مجموعة فرمية من 
اسم الاستقلال المحلي. ْ 

وهنا نشير إلى نقطتين مهمتين: الأولى هي أن الاستقلال المحلي واحادية البعد ليسا 
مفهومین متکافتین. فقد يكون الاختبار ثنائي اليعد إذا Way‏ أن سمتين متکافئتین لمجموعة 








مفحوصين متجانسين على كلا السمتين وفقراتهما مستقلة محلياًء وبشکل عام فإن ابعاد 
الاختبار يساوي عدد السمات الكامنة اللازمة لتحقيق الاستقلال المحلي. 

والثانية: أنه لا يمكننا القول بالتاکید وجود سمة واحدة فقط cel gl)‏ عدد اخر منها) بحيث 
كين الدقزاف ممق مادا فان الامتقلال اطي aces‏ بات الكامنة افتراضيات 
اة ونم دالو فة پمک الكحقق نشخ تفه هذه الانتراضنات» وسقیم اترا المداسة 
لهذا الموضوع والمذكورة في أدبيات القیاس. 
- وفي البد». اقترحنا معنى دقيق لقولنا بأن سمة كامنة تفسر الأداء على فقرات الاختبارء 
ويبساطة فإن هذا يعني أن السمة الكامنة تفسر الاعتماد الاحصائی عبر الفقرات: كذلك فليس 
من الضروري أن تكون السمة الكامنة قياس احصائي صادق للبناء الذي تهدف فقرات 
الاختبار قياسه. وهذا يعني أن الفقرات قياسها ضعيف للبناءء وعلى هذا فإنه يجب أن لا 
نساوي بين فكرة السمة الكامنة بالفكرة الأكثر عمومية للبناء. 


ولتوضیم مفاهیم احادية البعد والاستقلال اللي سنتعرض مثال افتراضي لعينة 
مفحوصین passe‏ )200( تقدموا لاختبار مولف من Leash‏ فقرات» ومع ان هذا لا یشبه موقف 
الاختبار الحقيقي إلا أنه يمكن افتراض نماذج الاستجابات الخمسة الملاحظة كما هي مبنية 
في الجدول )1-15( gly‏ استجابات.(40) مفحوص تطابق أحد التمانج الخمسة: ویقال 
cabal‏ الاستجابات الخمتتن هذه اتها تشکل فرج جوتمان التام (والنداریج من هذا التمط 
موضحة باختصار في الفصل الثالث). 


جدول )1-15( انماط الاستجاية لاختبار افتراضي مولف من آربع فقرات 
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وتتسق أنماط الاستجابة فى جدول (1-15) مع فكرة أن استجابات الفقرات جميعها 
تعنمه علی Lees‏ كامتة ولهدة وان النحتی المیز لكل فقرة عبارة عن د اله dai ALA‏ 
الشكل (3-15) دالة الخطوة للمنحنى المميز للفقرات الأربعةء وتمثل الرموز )01 و۰0 03, 
4) درجات السمة الكامنة مرتبة تصاعدياً. فالفحوص الذي قدرته الكامنة أقل مرتبة 
تصاعدياًء فالمفحوص الذي قدرته الكامنة اقل من 01 تكون إجاباته خاطئة على الفقرات 
الأريعة جميعهاء وبالتالي فان نموذج استجابته هو ( -, - - »- ). 

والفحوص الذي قدرته الكامنة تقع بين 01 و 02 يجيب إجابة صحيحة على الفقرة الأولى 
فقط. ويالتالي فإن نموذج استجابته يكون )+ ۰-۰-۰ - ). ويبين المحور الأفقي للشكل (15- 
3( نماذج الاستجابة للنقاط الآخرى علی تدریج السمة الكامنة. 


1.00 
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شكل (3-15): دالة الخطوة للمنحنيات المميزة للاختبار المؤلف من 4 فقرات 
جدول (2-15): التوزيع المشترك لاستجابات المفحوصين جميعهم 


الفقرة الرابعة 
of‏ 

الفقرة 

الثالثة ‏ س 
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لنركز الآن على الفقرتين الثالثة والرابعة» ويبين جدول )2-15( احتمالية أنماط الاستجابة 
الممكنة على هذه الفقرات» وهذه الاختمالات للمفحوصين جميعهم وعددهم )200( مقحوص» 
وبالتعريف فان الاستجابات على هذه الفقرات مستقلة احصائياً إذا وفقط إذا تحققت 
معادلات )1-15( الأربعة جميعهاء وإذا استخدمنا الاحتمالات المبينة فى جسدول (2-15) 
فإنه من الواضح عدم تحقق هذا لهاتين الفقرتين فمثلاً )+ و +( =P‏ ۰020 بينما قيمة 
x 0.2=Py(+) ۰۳3)‏ 204 0.08 لذا فان )+ و +) PyC+) P3 = P‏ واحصائياً فان 
الفقرتين غير مستقلتين احصائياً (أي محلياً) عن الجتمع الكلي للمفحوصين. 

ويمكننا القول نتيجة لذلك أن هاتين الفقرتين تشتركان في مصدر تباين» وبإجراء العملية 
نفسها لكل زوج من الفقرات يمكن أن نبين أن استجابات الفقرة تعتمد عى الفقرات الأخرى 
في الاختبار. 


إن متطلت احادية البعد يعني وجود سمة كامنة واحدة لكي يكون زوج الفقرات مستقل 
Aka‏ وهذا يعني الاستقلال الاحصائي لفقرات أي مجتمع فرعي متجانس على السمة 
الكامنةء وسنبدا باختبار ما إذا كانت الفقرتين الثالثة والرابعة مستقلتين محلياً لفئة 
الفحوصین للقدرة الكامنة (03) (وهؤلاء عبارة عن المفحوصين ذوي نمط الاستجابة (د) في 
جدول (1-15))» ويبين جدول )3-15( احتمالية كل نمط استجابة للفقرتين الثالثة والرابعة 
لمجتمع المفحوصين الفرعي ذوو القدرة الكامنة )83( ولكي تكون استجاباتهم مستقلة 


تانب يسن ان سفق العاذقات: 
P; (+/03) . P; (+/03) = P (+, +/03)‏ (1-2-15) 
P; (4/83) . Pj (-/03) = P (+, - /85)‏ )22-15( 
-Pi (/0) . Pj (4/03) = P (-, + /83)‏ )222-15( 
P; (/03) . Pj (-/03) = P )-,- /83)‏ (15- 2س) 
جدول )3-15( التوزيع المشترك لاستجابات الجموعة الفرعية عند 6-0 


الفقرة 4 


+ 





1.00 


= 3 
0 





1.00 0.00 
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وتشير الرموز إلى الاحتمالات الممكنة جميعها عند 0 على متصل السمة الكامنةء ومن 
الاحتمالات الينية في جدول )3-15( ol cass‏ الاحتمالات الأريعة الممكنة تتحقق, ولهذا فان 
الفقرتين الخالثة والرابعة مستقلتين EN‏ للمفحوصين الذين سمتهم الكامنة 0 <و0, 
وثانية. بإجراء هذه العملية لكل زوج من الفقرات وعند كل نقطة على متصل السمة الكامنة 
يمكننا تبيين أن الاستجايات على ازواج الفقرات جميعها مستقل احصائيات عندما تبقی 
درجة السمة الكامنة ثابتةء وعلى هذا فان الفقرات مستقلة اتا 


وکما سنبين فيما بعد فان الاستجابات على الفقرة غير مستفلة للمجتمع الكي. » ويالتالي 
فإنها تشترك في واحد أو AST‏ من مصادر التباين المشترك» كما سنبين أيضاً وجود السمة 
الكامنة بحيث أن الفحوصین المتجانسين بالنسبة للسمة الكامنة تكون مستقلة محلياً؛ وفي 
هذه الحالة يقسر التباين المشبترك بين الفقرات ككل بالسمة الكامنة الوحيدة» وكنتيجة فإر' 
الاختبار بحقق احادية البعد. 


القیاس التحرر من عينة التطبیق: 

النقطة المهمة في نماذج السمة الكامنة آنها تسمح بمقارنة الفحوصین حتی عندما یتقدمون 
لاختبارات مختلفة؛ ویشار إلى هذا أحياناً بأن القیاس متحرر من عينة التطبیق. ولتوضیح 
هذه الخاصية افترض أن الفاحص يعرف بأن الفقرات الأريعة لها دالة الخطوة ICC‏ الوضحة 
في شکل )3415( وهنا يختبر آحد الفحوصین بالفقرتین الأسهل, والفحوص الأخر یختبر 
بالفقرتین الأصعبء وأجاب الفحوص الأول على الفقرة الأولی إجابة صحيحة وعلی الفقرة 
الثانية إجابة خاطئة؛ لذا فإن قدرة هذا الفحوص تقع في الفترة )26 0 022 » Lais‏ آجاب 
الفحوص الأخر على الفقرة الثالثة اجابة صحيحة وعلی الفقرة الرابعة اجابة خاطنة. استنتج 
الباحث أن القدرة الكامنة للمفحوص تقع في الفترة 203 9 >04 مقن ان مسقم 
الفاحص أن قدرة المفحوض الأول أقل من قدرة الفحوص الثانيء ويوضح هذا المثال آنه. 
rere‏ نظرية السمة الكامنة يمكن وضع المفحوصين على التدريج نفسه حتى عندما 
يتقدمون لفقرات اختبارية مختلفة. وهذا يشير إلى أن الفقرات جميعها تقيس السمة الكامنة 
نفسهاء والمقارنة الدقيقة بين هذين المفحوصين في هذا المثال غير ممكنة بسبب قصر الاختبار, 
ويوضوح فانه إذ! تم بناء اختبار بعدد اكبر من الفقرات التي لها دالة منحنى مميز يمكننا 
اجراء مقارنة أكثر دقة. وعلاوة على ذلك فإن إحلال المفحوصين الذين تقدموا لاختبارات 
مختلفة على تدريج مشترك يكون لاختبارات مؤلفة من فقرأت تتمييز بمنحنيات مميزة للفقرة 
old‏ صيغ أخرى؛ وقد أجريت دراسات معادلة تستخدم نظرية السمة الكامنة وتعتمد على 
الاختبار كقياس متحرر من عينة التطبيق من قبل )1977 s(Rentz&Rashaw,‏ (۲1۵۲>0,1977). 











الشحنی الطبيعي: 

إن معظم تطبيقات نظرية السمة الکامنة تفترض أن النحنی المیز للفقرة له الشکل S‏ 
وآحدها هو النحنی الطبيعي والذي طبق بكثرة في الأعمال المبكرة لنظرية السمة الكامنة 
(انظر )1943 (Lawley,‏ و )1953 ,19520 (Lord,‏ ويبين الشکل (4-15) خصائص مهمة 
عديدة للمنحنی المیز للفقرة للمنحنی الطبيعي: 


الذين [جاباتهم 





السمة الکامنة (8) 


شکل (4-15): النحنی الطبيعي المیز للفقرة, متوسط القدرة = صقر والاتحراف امعياري = 1. 

1- يرتفع النحنی باضطراد بالاتجاه من الیسار إلى اليمينء ومثل هذا المنحنى يقال أنه 
یزداد باضطراد. 

2- يقترب الخط التقاربي الأدنى من الصفر ولکنه لا یصل إلى الصفر lash‏ ویصل الخط 
التقاريي الاعلی إلى 1. ۱ 

3- يرتبط النحتی الطبيعي مباشرة بالتوزيم الاعتدالي الطروح في الفصل الثانيء وتعلمنا 
أنه Losie‏ نعبر عن الدرجات بالدرجات الزائية ails‏ یمکننا استخدام جدول التوزیع 
الاعتدالي العياري للحصول على المساحة تحت المنحى الطبيعى على يسار الدرجة 
للمنحنى الطبيعي الاعتدالي عبارة عن دالة للدرجات الزائية. 

وعند استخدام النحنی الطبيعي على أنه منحنى مميز اللفقرة فإن القیم على المحور الافقي 
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تمثل القيم الممكنة للسمة الكامنة 0. وارتفاع النحنی عند أي من قيم 0 تمثل نسبة الفحوصین 
ويمكن كتابة معادلة المنحنى المميز للفقرة للمنحنى الطبيعى على النحو الأتى: 


W 


Bis f f (z) dz = P, (8) 


0 - 
على الفقرة g‏ إجابة صحيحة: والتعبير الذي يمثل التكامل في المعادلة يعني المساحة بين © و 
0 تحت المنحنى الطبیعی» و 00 عدد حقیقی يتحدد بالعادله: ۱ 

Sea a(0-b)=w‏ عه 

حيث ترمز 2 إلى معلم تمییز الفقرة» و 8 إلى معلم الصعوية, (وهذه ليست معالم الصعوية 
والتمییز في نظرية القیاس التقلیدیة), وتشبه 0 أو القيمة الكاقنة لها " (0-0) ۵ الدرجة 
الزائية " وذلك لأن P(A)‏ تمثل الساحة على يسار (0- 0) a‏ لنحنی التوزیم الاعتدالي العياري, 
لذا فإن امتلك القحوص درجة قدرة كامنة 250 وکانت قيم العالم للمنحنی المیز للفقرة g‏ 
هی: 05-2 و ا=10 

فان ه لهذا الفحوص تساوي: 

a(@-b)=w 

‘5 (2-1.0) = 5 

وحيث أن المساحة على يسار 0.5 فى المنحنى الاعتدالى = 0.69 فإن استخدام المعادلة: 
(3-15) يشير إلى آن 0.69 من الفصوصین الذين سمتهم الكائنة 2-8 سیجیپ اجابة 
صحيحة على الفقرة ع » لذا فان توافر لدینا قیم کل من bya‏ للفقرة B‏ ونرید معرفة نسية 
المفحوصين عند قدرة كامنة معينة الذين يمكنهم الإجابة عن الفقرة اجابة صحيحة علينا: 

.a (8-b) حساب قيمة‎ -1 

2- استخدام هذه القيمة لاستخراج (78)0 من جدول الدرجات الزائية الاعتدالي المعياري. 
المتعلقة بالنحنی المميز للفقرة ترمز للمعالم بالرموز ag‏ , ۰02 حيث يدل الحرف g‏ على الفقرة 8 
فى الاختبار» لهذا فإن معادلة المنحنى المميز للفقرة للمنحنى الطبیعی تكتب على النحو الاتي: 
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2)0 - bg) 


(SAS) cue f f (z) dz = P, (8) 


-Q 


حيث أن =O‏ (و0-9) ag‏ ولنرى الآن كيف يعمل معلم الصعوية Dy‏ دعنا نتعامل مع ثلاث 
فقرات لها قيم ag‏ نفسها وتختلف في Dy asd‏ وهذه القيم هي: را = 0.5 , 1.5=b3 :1.0=b2‏ 
ويبين الشكل (15 -5) المنحنى المميز للفقرات الثلاث: وعلى كل منحنى خط عمودي نازل على 
ديل are‏ الكامنة عند =P,(0)‏ 0.5 كا الاق فإن درجات السمة الكامنة 
تساوي 0.5 عند b2=‏ للفقرة الثانية وللفقرة الثالثة فان ( 020۵60 عند 1.0 1.5 لاحظ أنه 
للفقرة الأولى أن (۳)0< 5 عندما تکون 0 = راء وبصورة مشابهة فان (0). = 0.5 
عند 0= للفقرة الثانية. وللفقرة الثالثة لذا فان (0)و۳ = 0.5 عند 0عوط لذا فان =bg‏ 
درجة السمة الکامنة عندما يجيب 50 % من الفحوصین إجابة صحيحة على الفقرة g‏ 

لذری كيف يعمل alae‏ التمیین ag‏ دعنا تتعامل مع ثلاث منحنیات مميزة للفقرات في 
الشكل 6-15 قيمة 9 لكل منها تساوي 1.5, ولکن asd‏ 8 هي: ره = 0.1 › ره = 1 .= 100. 
ag‏ وعند النظر إلى الفقرة الاولی نری آنها تمیز بفعالية oY‏ نسية الفحوصین الذین آجابوا 
على الفقرة أجابة صحيحة هو نفسه د تقريبا عند رجات السمة BS‏ تسيا كذلك فان 
الفقرة 3 تميز بفعالية عالية بين الفحوصین الذين درجاتهم أقل من 1.45 وأعلى من 1.55 
وفي الواقع فإن نسبة المفحوصين الذين أجابوا اجابة صحيحة أقل من 0.01 للذين سمتهم 
الكامنة 0 أقل أو تساوي 1.45 في حين آنها أكبر من 0.99 للذين سمتهم الكامنة 6 أكير أو 






قتساوى 1.55 . 
1.00 
الذين اجاباتهم 
صحيحة 
ee e‏ یس یت سبح مس SQ e‏ 
i‏ 
i‏ 
j‏ 
Í‏ 
i‏ 
i‏ 
1 
1 
I‏ 
00- 
o 201 23 3‏ 1- 32- 3= 
السمة الكامنة )0( 
شكل (2-15) خلائة منحنيات لها قيم و = 0,5 »رظ = 1,0 , وط = 1.5 
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وأخيراً فإن الفقرة الثانية لها 1 a=‏ تكون متوسطة من حيث تمميزهاء لذا فإن ag‏ هو 
العلم الذي يحدد ميل آو شدة انحدار المنحنى المميز للفقرة, فالفقرات غير الفعالة في تمييزها 
عند مستويات القدرة جميعها تكون ذات منحنى jane‏ مستو مع انخفاض قيم Ag‏ والفقرات 
التي تميز بشدة بين المفحوصين عند قدرة معينة (أعلى منها وأدنى منها) يكون المنحنى المميز 
لها شديد الانحدار مع ارتفاع asd‏ و » بينما الفقرات متوسطة التمييز عبر مدى وأسع من 
القدرة يكون معدل انحدار المتحنى المميز لها معتدل مع اعتدال في قيم ag‏ أيضاً. 


تدريج القياس: 

إن تدريج متصل السمة الكامنة المبين في المعادلة )4-15( له نقطة أصل مناسبة, وكذلك 
الأمر بالنسبة لوحدة القیاس, ويقصد بنقطة الأصل المناسبة أنه ولأي مجتمع فرعي متجانس 
يمكن أن يؤشر بالدرجة صفر لسمته الکامنة. إذ لا يمكن أن يتميز أي مجتمع فرعي بالغياب 
الكامل السمة الكامنة. ويقصد بوحدة القياس الناسبة أنه بعد تعيين الدرجة الكامنة صفر 
لاحدی الجموعات فانه یمکن لجموعة الخرى قدرتها الكامنة اعلی من قدرة الجموعة الصفرية 
تعيين واحد على درجة السمة الكامنة لها. وفرق القدرة بين هاتين الجموعتین الفرعيتين هو 
وحدة القیاس, ولأن كل من وحدة القیاس ونقطة الاصل نقاط اعتبارية (اصطلاحیة) فانه يتم 
اختیار نقطة الاصل ووحدة القیاس بحیث یکون متوسط السمة الكامنة ضفن وانحرافها 
العياري واحد لاحدی مجموعات القدرة أو السمة الكامنة. ونتيجة لذلك فمن المکن ایجاد 
مخطط للمنحنی المیز للفقرة كما في الشکل )5-15( وبتدریج یتضمن الأرقام الموجبة 
والسالبة على حد السواء. 

وتعتمد قيم كل من ag‏ و علی الوحدة والتدريج الختارین ل 0 » فان تغيرت قیم الوحدة 
والتدریج لدرجات السمة الكامنة والتي يرمز لها ب 0 یکون مکافی لتحویل 0 وفق المعادلة: 


(6-15) cecccsssssessee KO+m=@ 


حيث أن WS‏ من k , m‏ اعداد حقيقية, و 6 درجة السمة الكامنة على التدريج الجدید. 
A \‏ 58 











2 * ۱00 


4.0 ره 


01 * ره 





0 5 LO 1.5 20 15 3.0 
(0) السمة الكامنة‎ 
100 = a3 0۳-1 =a. 6.1 = ay متحديات مميزة للققرة لها قيم‎ dai :)6-15( شكل‎ 
(î 7 -15( EF Kb, + m = bg 
1ب(‎ -15)............ K ag +m =ag\ 
ويمكننا أن نبين بسهولة أن‎ 
اوه‎ (6`-bg\) = ag (0 -bg) 


وبالتالي فإن (0)ج1 لا تتغير بتغير وحدة القياس وتدريجة. 


ريط نظرية الاستجابة للفقرة بنظرية القياس التقليدية: 
معالم النحنی المميز للفقرة واحصائیات الفقرة التقليدية: 


لتکن رم تمثل معامل ارتباط بایسیریال جت درجات الفقرة ع درجات السمة الكامنة من 
الواضح ان هذا الارتباط مشایه Jalal‏ ارتباط بایسیریال بین الفقرة والدرجة الكلية والذي 
یستخدم لیمثل معامل التمييز عند تحلیل الفقرات بنظرية القیاس التليدية فإن كان توزیم8 
px‏ 


j- be m ag 
۱ 
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جدول )4-15( المناظرة بين Pg gg‏ 





لذاء فان كان معامل أرتياط يا JL‏ لفقرة ما مع السمة الكامنة =P,‏ 0.30 فان قيمة 
إن کان رتباط بأيسيرد مع Px‏ إن قد 


a plas‏ للمنحنى المیز للفقرة يكون 
ا - 0.31 
ag‏ = 





ويبين الجدول )4-15( قيم ag‏ المناظرة لعدة قيم Dg‏ ويتبين من الجدول أنه كلما اقتربت 
bg‏ من واحد فإن قيم ag‏ تزداد» لذا فمن البداهة أن مثل هذه العلاقة تدعم تفسيرية على أنه 
معلم تمييز (معامل تمييز). 

ويمكن ربط معلم الصعوبة للمنحنى المميز للفقرة وابمعاملات تحليل الفقرة التقليدي 
ايضاً. ويمكن ان نبين انه ووفق افتراضات التوزيع الاعتدالي أن: 


pC Pg) _ 





bg 


- Pg 
الى الدرجة‎ O's) الى نسبة الاجابات الصحيحة لعامل صعوية الفقرة و‎ Pg حيث ترمز‎ 
الى يسار الدرجة الزائية في التوزيع الاعتدالي. ومن معرفتنا‎ py الزائية التي تقطع المساحة‎ 
. باستخدام جداول مثل الجدول المبين في اللحق أ‎ (Pp) يمكننا الحصول على قيمة‎ Dy لقيم‎ 
0.30 للفقرة تساوي‎ Py وكانت‎ 1.00 = 41) Py) و‎ 0.84 =py فعلى سبيل الثال اذا كانت‎ 
للفقرة على النحو:‎ bg فإنه يمكن حساب قيمة‎ 














333- = 1.00 - = b 
0.30 & 


المنحنيات المميزة للفقرة والثبات التقليدي: 
وكما يأتي: 
OES 2 Pg(0) =T‏ 
وهذه المعادلة صحيحة بغض النظر عن النحنی المیز للفقرة » وتبين ان العلاقة بين ST‏ 
0 ليست Me‏ احصائية » قالدرجة الحقيقية عبارة عن تحويل غير خطى للسمة الكامنةء ويبين 
جدول )15 -5) العلاقة بين T‏ و 0 لاختبار افتراضي مؤلف من ثلاث فقرات: 








جدول )5-15( العلاقة بين السمة الكامنة والدرجات الحقيقية : 








-0.5 =b, 0.2= az 0.5 = bz 0.5 = a2 0= by I= ay 


الانحدار للتنيق ب × من درجات 9 asl‏ اللنحن أ ر للاختبار ومنحد الانحدار هذا 
۱ 2 سار ومفحدى 
مشابه لنحنی العلاقة بين T‏ و 8 لذا فان معادلة X‏ هی: 


TEE 50) +B=X 
2 8 
القياس استنتاجاً من العادلة (10-15)ء ما مقدار القوة في العلاقة بين × و‎ tha و 8 هى‎ 
pall الانسب هذا استخدام معامل الارتیاط غیر‎ 
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i E0 o 2(x/0) | 


GS ieia 2 
۱ Ox 


Nx 0 


وذلك لقياس قوة الارتباط بين × و 0 . اذ ترمز (2)2/0 0 الى تباين X‏ لمجتمع فرعي 
متجانس. ويمكن تبيان ان هذا التباين (2)8/0 © اي خطأ تباين الجتمع الفرعي مساوياً 
لتباين المجتمع الفرعی. كذلك يمكن تبيان ان £٥ 2(x/8)‏ مساويا لتباين الخطأ المحدد 
كلاسيكياً. ونتيجة ذلك يمكن اعادة كتابة العادلة )12-15( على النحو الآتي: 








o 2E 
ا يي‎ 
۱ ox 
و يمكن رؤية ان هذا مساوياً لمعامل الثبات والمذكور في الفصل السادس. لذا فإن قوة‎ 

العلاقة بين × و 0 يساوي oles‏ ثبات الدرجات X‏ 





النماذج اللوغاريتمية: 
یعد النحنی الطبيعي الصيفة السائدة للمنحنی المیز للفقرة في الابحاث الاولی لنظرية 
السمة الكامنة وقد حل الیوم مکانها نماذج لوغاريتمية BIS‏ تتطلب حسابات ابسط . وفي 
اة افا سق Ole ie‏ ليذه الان ورام مجو ب ان فى ساب 
معالم هذه النماذج: ung‏ مثال نين العلوتات التي تحصل عليها من أحد SEN‏ البرامی:" 
تعد دالة النحنی اللوغاريتمي التراكمي اساس النحنی المیز للفقرة في هذه النماذج 
B‏ وهذه الدالة لها الصيغة العامة الآتية : 








ex 
EE TERA | تسس سم‎ PG 
(13-15) ae PLO) 
حيث ترمزء الى الاساس للوغاریتم الطبيعي, و × هنا رمز اصطلاحي لا يقصد به الدرجة‎ 
الملاحظة. ويعد المنحنى المميز للفقرة فى النماذج الثلاثة تباين فى الصيغة العامة للمعادلة‎ 
. الفقرة‎ alles وتختلف هذه النماذج عن بعضها البعض في عدد‎ «(13 -15( 


النموذج ibis‏ المعلم: 
من الانسب البدء بالنموذج ثنائي العلم لاته الاكثر تمثيلاً النموذج الطبيعي, وللنموذج ثنائي 
المعلم الدالة: 
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D ag )0- bg) =x 

اذ يمكن تحيد D‏ اصطلاحاء والشائع ان لها قيمة تساوي )1.7( وذلك PONY‏ 
للمنحنيات الطبيعية واللوغاريتمية لا تختلف عن بعضها البعض بأكثر من (0.01) لأي من قيم 
8 أي درجة السمة الكامنة )1968 , (lord & Novick‏ والمعالم ag‏ و Dg‏ لها الدور نفسه في 
النماذج اللوغاريتمية جميعهاء وكذا الحال في نموذج المنحنى الطبيعي. وپالاسماء هي: معامل 
الى صيغة النموذج ثنائي المعلم: 


Pag (0 - bg)‏ م 
SPO)‏ اس سح نامه سر CTALTS)‏ 
e Pag(® - bg)‏ + 1 








التموذج احادي العلم 

ieee‏ النموذج احادي المعلم على انه Ula‏ خاصة للنموذج ثنائی المعلم الذي يكون 
لفقراته كلها معلم التمييز نفسه» ولان الفقرات كلها لها المعلم نفسه فإننا نرمز له بالثابت Ya‏ 
المتغير âg‏ ءودالة النحنی المميز للفقرة احادية المعلم هى: 





Da (6-0)‏ ی 
(۳,0- سس C515) tne‏ 
e Pa(b-0)‏ + 1 
ويمكن كتابتها بالصورة الآتية أيضاً: 
bg”)‏ ۳ 0( 
۲,09 - شش امن يعي )16-15( 
dbg‏ © +1 


حيث ان 0= Da0‏ و Dabg=bg*‏ .لذا فان *0 تعد تدريج جديد للقدرة 0,ویعبر عن 
bg“‏ على التدريج الجديد. وعند UES‏ صيغة الدالة بهذه الطريقة فان الصيغة تؤكد ان نسبة 
الفحوصین الذین یستجیبون بصورة Taunus‏ وعلی Gay‏ النموذج احادي العلم تعد دالة 
لقدرة الفحوص وصعوية الفقرة. واشتغل راش بمفاهیم تختلف عن النحنی المیز للفقرة 
وطور تموذج سمي پاسمه وهو مکافی للنموذج احادي العلم. وقدم رایت(1968 , (wright‏ 
تفسيراً اتجاه راش التطوّري» ومن المکن ملاحظة انه يوجد نموذج منحنی طبيعي مشابه 
للنموذج احادي المعلم. l‏ 
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حت 468 
= 





التموذج ثلاثي المعلم: 
قد تظهر مشكلة النمودج الطبيعي والتماذج اللوغاريتمية احادية العلم وثنائية المعلم عند 
تطبيقها على بيانات فقرات الاختيار من متعدد أو الصح والخطاء وذلك لان هذه الصيغ جميعاً 
القدرة المنخفضة أن تكون النسبة التى تجيب بصورة صحيحة ستكون اكبر من الصفر وذلك 
النموذج ثلاثي العلم بسبب هذا العامل. ومعادلة هذا النموذج هي: 
(1-C,) e Pas )0 - bg)‏ 


(17-15)......... جس‎ E Ca PO) 
با‎ 62026 -99( OS 


Gis‏ علي © لسو مه امین وی شک( 13 75( E‏ لماع سود 
Ole Cg‏ ویلاحظ آن النحنی المیز للفقرة یقترب من 0.1 بانخفاض القدرة, وعلی هذ! فانه 


للنخفضة ا 6 
1.00 
الذين اجساباتهم 
صحيحة 
L‏ 50 
=i ot 2 3‏ 3 3~ 
السمة الكامنة (8) 


jsut‏ ( 15 - 7): النموذج اللوغاريتمي تلاثي المعلم. 











حساب المعالم 


يجب حساب قيم المعالم cg «ag bg‏ لكل فقر, فقرة اعتماداً على sal‏ النماذج اللوغارية 
وعلى الأقل فإن هنالك طريقتين شائعتين للحساب هما دالة الأرجحية القصوى gi a‏ 
التقريبية. وهنا سنقدم مراجعة لطريقة الأرجحية القصوى. وقدم سواميناثان 
(swaminathan , 1983)‏ عرض وافي وتقني لطرائق الارجحية القصوىء وقدم وود ووينغر سكي 
(lord , 19768: wood , wingersky).) 919‏ بر نامج لوحست (logist)‏ الحوسب المستخدم لحساب 
الارجحية القصوى للنموذج ثلاثي المعلم. ويحسب هذا البرنامج معالم الفقرة للفقرات جميعها 
ودرجات السمة الكامنة للمفحوصين جميعهمء ويشار الى هذه الطرائق بالارجحية القصوى 
المشتركة, ولهذه الطريقة شروط عدة يجب توافرها عند استخدامها مع النموذج اللوغاريتمي 
ثلاثي العلم وهي: 

أولاً: تتطلب عدد اساسی من الفحوصین للتقدیر الدقیق, وفی دراسة & (Hulin , lissak‏ 
drasgow,1982)‏ التي بینت أن دقة الحساب باستخدام النحنی المیز للفقرة ثلاثي العلم 
لاختبارات مولفة من 30 فقرة و 60 فقرةء ووجدوا ان تقدیرات المعالم تصبح آکثر دقة عند 
الانتقال من (200 الى 500 الى 1000( مفحوص. والدقة لا تتحسن بالدرجة نفسها عند 
الانتقال الى )2000( مفحوص, كذلك فان دراسة هولین وزملاژه تقترح تکبیر حجسم 
العينة للحصول على تقديرات دقيقة ل ag‏ ونتائج مشابهة توصل اليها (lord , ee‏ و 
(Ree & jenesen, 1980)‏ و )1979 (swaminathan & Gifford,‏ إن استنتجوا الحاجة الى 
Tae‏ كبيرة لحساب معالم الفقرة (واشرنا في السابق الى استتخاج هولین باه یلزم حجم عة 
اصغر بکثیر عندما یکون الهدف الرئيسي تقدپر 0) . 

ثانياً: لغاية الآن لا نعرف ان حساب العالم یکون متسقاً. فالطرائق التي تؤدي الى 
تقدیرات متسقة لعالم الفقرة لا نعلم ما إذا كانت تقدیراتها تقترب اکثر واکثر من القیم 
الحقيقية للمعالم بزيادة حجم العينة Sly AS!‏ 

وطريقة اخری لحساب معالم التموذج ثلاثي العلم هي الارجحية القصوی الهامشية (وفي 
الادب البکر كان يشار الیها باسم الارجحية غير الشروطة) وحتی الوقت الحالي فان هذه 
الطريقة لها محددات عملية تعوق استخدامها. ومع ذلك فان کل من (1981, (Bock & atkin‏ 
طورا طريقة لحساب معالم تتغلب على الشکلات العملية واستخدموها مع النموذج الطبيعي, 
وبینوا امكانية تطبيقه على النموذج ثلاثي العلم. ويخدم برنامج (BILOG)‏ الحوسب النماذج 
الاحادية والثنائية والثلاثية العالم» ویوزع من قبل شركة soft ware‏ 5616011110 والفائدة 
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wolfowitz, 1956)‏ ۱ 
والبرنامج الاكثر انتشاراً في امريكا الشمالية لحساب معالم النموذج احادي العلم هو 
برنامج بيكال (BICAL)‏ والذي طوره (Wright, Mead & Bell,1979)‏ ويحسب هذا 
البرنامج تقديرات الارجحية القصوى المشتركة (ويذكر كل من رايت وميد وييل أن هذه 


واتکین» وهذه الطريقة y‏ توفر معالم متسقة:؛ لذا فإن رايت ودوغلاس أوجدوا عامل تصحيح 
يجعل هذه التقديرات متسفة. وتستحدم الارجحية القصوى المشروطة في غرب اورویا في 
حساب المعالم وحتى الوقت الحالي فإن هذه الطريقة تعد عملية فقط مع الاختبارات القصيرة 
التي فقراتها أقل من 30 أو 40 ( 1980, (Wainer , morgan & Gustafsson‏ والتطورات ٠‏ 
الحديثة جعلت من الممكن استخدام هذه الطريقة مع اختبارات مولفة من 80 إلى 100 فقرة 
(Gustafsson , 1980)‏ وتکمن أهمية طريقة الارجحية القصوی المشروطة Gl‏ تقديراتها 
تفسير مخرجات برنامج بيكال: 

فا spall‏ مكحن من مفرجات بزنامع بیکال: وقد طور هذا البرتامع من قبل رانك ومید 
(wright , Mead & Bell , 1979) Jus‏ للتحلیل Gay‏ النموذج احادي العلم (نموذج راش)» 
وقد اختیر عرض مخرجات هذا البرنامج GY‏ الاسهل تفسيراً للمبتدئين والاکثر انتضارا 
يقدم معلومات اخری مهمة غير تلك العروضة هنا. 

وفي عرضنا هذا سنرکن على BIE‏ انواع من الخرجات: 

1 تقدير صعوية الفقرة. 

2. تقدير قدرة المفحوص. 

=a‏ معلومات حول مطابقة الفقرة. 

ومثالنا يعتمد على استجايات 143 مفحوص على )20( فقرة اختبارية من نوع الاختيار 
من متعدد في الرياضيات (وللتنويه نذكر ان حجم العينة المستخدم للتوضيح أقل بقليل من 
آقل حجم لهذا البرنامج وهو 200 مفحوص) وقبل عرض الاقتباس المذكور سنصف باختصار 
طريقة الارجحية القصوى غير المشروطة (وسميت بالطريقة غير المشروطة من قبل رايت وميد 
Sass‏ ولکنها في الحقيقة طريقة أرجحية قصوى مرتبطة) ,وتستخدم هذه الطريقة مجموعة 








معادلات تكون فيها صعوية الفقرة ودرجة السمة الكامنة غير معروفة, ویبدا تنفيذ الطريقة 
بحساب قيم أولية لتقديرات الصعوية ودرجة السمة الکامنة» وتعد هذه القيم تخمينات حول 
تقدیرات الارجحية القصوی غير الشروطة. ویستخدم البرنامج الحوسب هذه الطريقة بطريقة 
تؤدي الى مجموعة ثانية لتقدیرات الصعوية والسمة الكامنة. وتستخدم الجموعة الثانية لانتاج 
مجموعة ثالثة وهكذاء ویستمر تکرار الحساب حتی دورة اخری یکون Lead‏ التغیر في تقدیرات 
العالم اقل ما يمكن: وتتضمن الجموعة الاخيرة تقدرات الارجحية القصوی غير الشروطة, 
ویبین جدول )6-15( في الاعمدة الخمس الاولی بیانات حول تقدیرات صعوية الفقرة, إذ 
يحتوي العمود الأول على آرقام الفقرات. وهي هنا من )1 إلى 20(« والعمود الثاني يعيد ترقیم 
الفقرات بطريقة جديدة مناسبة وفي هذا المثال یستخدم رقم الفقرة. ویقترح استخدام محتوی 
الق ات كلك وال الات تسعرية الق gist oR‏ موی القدرة لكل فقو على 
تدريج السمة الكامنة عندما يجيب 9650 


جدول (6-15): ميانات صعوبة الفقرة من برتامج النموذج أحادي المعلم بیکال 






































سسحت 472 





من المفحوصين بصورة صحيحة على الفقرة. بكلمات أخرى تعد هذه القيم تقديرات ل DX‏ 
لكل فقرة. ومن هذا العمود نرى أن الفقرة الأولى هي الأسهل إذ يجيب 50من المفحوصين 
على الفقرة الذين درجة سمتهم الكامنة (-2.79). بينما الفقرة )20( الأخيرة هي الأصعب إذ 
یجب ان تکون Lays‏ السمة الكامتة (1.719)حتی یجیب 950 من القسوضين على الفقرة 
بصورة صحيحة. والعمود الرابع يبين الخطأ العياري لتقدیر صعوبة کل فقرة. فللفقرة الأولى 
نکون على ثقة %68 بان معلم الصعوبة یقم بين )-3.268( (وهي = -2.799 - 469 = 33.2( و 
=)-2.33( وهي ) -2.799 + 5.469 = 0). العمود الأخیر السمی آخر تغیر في الفرق يشير 
إلى اتجاه وحجم التعدیل الذي أجري على تقدیر الصعوية بعد التکرار الاخیر للبرنامج. ویری 
أن قیم معاملات الصعوية ثابتة نسبياً بعد التکرار الاخيرء ولکن هذا التقدیر للفقرة يتغير 
تو موه واكياقا Sala ce‏ امد كا مقي | درن یی GES‏ احا 
مميز ضمن مدى قدرة معين. وتفيد مثل هذه البیانات في بناء اختيارات الاختيار من متعدد 
وذلك للتأكد من أن درجة الصعوية نفسها للفقرات جميعها. 

ويبين الجدول (7-15) المعلومات المستخدمة لتحويل الدرجات الخام الى درجات قدرة على 
تدريج السمة الكامنة (القدرة الرياضية)ء العمود الأول المسمى العد يمثل عدد المفحوصين 
الذين حصلوا على درجة alà‏ معينةء والاخطاء المعيارية هي الاخطاء المعيارية لكل درجة قدرة. 
لاحظ ان هذه القيم هي الأقل في منطقة وسط التوزيع والاكبر عند القیم التقديرية المتطرفة. 
وتفيد بيانات درجات القدرة في تحديد درجات القطع ومعادلة درجات الاختبارات المختلفة 
(وستعرض هذه العمليات في الفصول التالية) . 

ويبين جدول ( 8-15) البيانات التي تستخدم لتقييم مطابقة الاستجايات الفعلية للنموذج 
اللوغاريتمي احادي المعلم. وتفيد هذه البيانات معد الاختبار في تحديد الفقرات التي لا تطابق 
النموذج احادي المعلم ( انظر: حسن المطابقة في الجزء المتعلق باختيار النموذج). وانظر أولاً 
الى جدول )15 -8 1( اذ تم تقسيم المفحوصين الى ستة مجموعات. المجموعة الاولى لها أقل 
درجات والمجموعة السادسة لها أعلى درجات. ويبين الجدول نسبة المفحوصين الذين اجاياتهم 
صحيحة على كل فقرة. على سبيل المثال: 








جدول )15 -7): تقديرات درجة السمة الكامنة المستخرجة من برنامج بيكال 





OE‏ التستوعة AM‏ جايو كديا E A‏ مسيم 9061 من 
اوه تایه Gee ly‏ هتسه lish‏ وفكلا eit‏ رد ا توق كسلا 
زيادة في نسبة الذين یجیبون اجابة صحيحة على الفقرة LS)‏ هو الحال في الفقرة 11) . 

وهذه النسب اللاحظة للاستجابات الصحیحة قورنت بالنسب النظرية التي يجي آن تظهر 
Lays‏ لو طابقت البیانات النموذج احادي العلم. ویبین جدول (8-15 ب) الفسب النظرية 
والفعلية لكل مجموعة, وتشیر القيمة (15 ,0 ) الى درجة الجموعة الاولی على الفقرة 11 ان 


سس 3 === 
































النسبة الملاحظة للاستجابات الصحيحة اقل من ۰9615 ويكلمات اخری فإن نسبة الاستجابات 
السحيحة اقل من 9615 . وپکلمات اخری فان نسبة الاستجابات الصحيحة من النحی المیز 
نقرة التوقم لجموعة هذه الدرجات يجب ان تکون 20 % + %15 = %35 وتشیر النسبة 
الئوية للمجموعة الثانية على الفقرة 11 انها اکبر ب %4 من النسبة التوقعة, لذا فإن %61 
من الجموعة اجابوا بصورة صحيحة على الفقرة و %57 منهم یجیبون بصورة صحيحة 
سس با وتوت من ا لديو ا نين جدول )8-15( لايل ine)‏ 
للتوافق بين النحنی المميز للققرة اللاحظ والمتوقع في العمود المسمى " المطابقة بين " (fit‏ 
between)‏ ولتفسير هذا الاحصائي يجب العودة الى التوسط صفر والانحراف المياري 
واحد. فإذا تمعنا في الفقرات التي لها قيمة احصائي مطابقة 2.00 أو اكثر نجدها للفقرات 
(1, 4 ,7 9. 12) إذ يبدو ان لهذه الفقرات قيم مطابقة مشكوك فیها (لاحظ انه لا يوجد 
اقساق في نسب القحوصین الذين يجيبون بصورة صحيحة في المجموعات الستة. ان قيمة 
احصائي المطابقة يتأثر بحجم البعد عن القيمة المتوقعة المنحنى المیز للفقرة. والتي تكون 
اوزانها مختلفة عبر مناطق مختلفة من النحنی). واحصائی مطابقة اخر یظهره النحنی یسمی 
اختبار ت - الكليء وقد وصف مولفی هذا البرنامع العامل على انه الاتفاق العام بين السمة . 
المقاسة بالفقرة وتلك المقاسة بالاختبار ككل وثانية يجب ارجاع هذه القيم الى التوسط صفر 
والانحراف المعياري واحد. وفي احصائي المطابقة هذا نجد أن للفقرات. 11و 17 قيم تزيد 
عن 2.00 مع ملاحظة انه للفقرة 11 معامل ارتباط بوينت بايسيريال بين الفقرة والدرجة 
الكلية هي الأعلى لفقرات الاختبار جمیمها(0.62), وسبب عدم الطابقة لمثل هذه الفقرة هو 
تمييزها الشاذ بالنسبة لفقرات الاختبار الاخرىء لذا فإنها لا تطابق النموذج أحادي المعلم 
الذي يتطلب تساوي تمييز الفقرات جمیعها, لذا فإن عدم مطابقة هذه الفقرة لا يعزى إلى خلل 
في الفقرة بل العلاقة بالسمة الكامنة لا يتم تمثيلها بشكل مناسب بالنموذج احادي المعلم, 
واقترح مطوروا هذا البرنامج مراجعة الفقرات اذا كان احصائي المطابقة بين اكبر من 3 أو 4 
او مطابقة Zak‏ تکیر من 2 وذاك Lal‏ پسبپ اخطاه مفتاحية ای اخطاء طباعة gh‏ اي عد م 
اتساق قد يسيب عدم الطابقة. وإن كان من غير المکن خفض احصائي الطابقة لاسباب تقنية 
ب تدقیق محتوی الفقرة اك من gf‏ الفقرة من حقل التغیر cajun‏ ویجب تذکیر 
te lal‏ بان هذه القترحات مبنية علی التجرية العلمية. ویمکن استخدام محکات اخری للحکم 


على درجة المطايقة. 









































وما يثير الدهشة هنا هو ان معالم الفقرات تتصف بخاصية عدم التباين عند حسابها 
پاستخدام احد نماذج السمة الکامنة» وفي أدب القياس يوجد تفسيرين على الأقل لعدم 
التباین, التفسیر الأول قدمه هامبلتون وكوك )1977 , (Hambelton & Cook‏ ولورد , (Lord‏ 
(980لوالذي giles‏ منحنی الفقرة على أنه منحنی انحدارء إذ اشار لورد الى أنه وفي 
السیاقات الاحصائية لا تتغير دالة الاتحدارعندما یکون توزیع متغیر الانحدار (وهو السمة 
الكامنة هنا) متغیر. ومع ان هذا صحیح الا انه لا يعني ان عدم تباين النحنی المیز للفقرة لا 
يتباين آلياً بالنسبة لاختیار الفحوصین 

٠‏ وقد عزا لورد )1980( ولورد ونوفيك )1968( عدم تباين هذا الى احادية البعد فقد وافقا على 

انه إذا تغير المنحنى المميز للفقرة عبر المجموعات الفرعية من المفحوصين مثل الذكور والاناث 
فإنه يوجد تغير منتظم على الفقرة ع بين الذكور والاناث الذين لهم درجة السمة الكامنة نفسها 
لذا فإنه لا يوجد سيب لاعتبار الاختبار احادي البعد. لاحظ أن منظور عدم التباين في 
الاختبار ليس من خصائص نماذج السمة الكامنة ولكنه متطلب منطقي لاحادية البعد. ومن 
هذا المنظور فإن عدم التباين الاختيار يعد افتراض منتهك عن قصد في التطبيق. ونتيجة ذلك 
فان التطبيقات التي تعتمد على افتراض عدم التباين يجب آن تتحقق من صحة هذا 
pall‏ 
حبك الاختبار 

عند استخدام الاختبارات المقننة تظهر مشكلة عدم فائدتها لبعض المفحوصين فمثلاً يكون 
العدید من فقرات الاختبار القنن صعبة جداً للمفحوصين ذوي القدرة التدنية, ویلجاً العدید 
من هؤلاء الفحوصین الى التخمين في الاجابة على العدید من الفقرات, لذا فإن هذه الفقرات 
تتضمن اخطاء قياس اکثر من العلومات القيمة عن الفحوصین, ايضاً افترض ان جامعة ما 
تقبل فقط 10 4 من مجموع التقدمین لامتحان القبول, وفي مثل هذا الوقف لا تساعد 
الفقرات السهلة فى التمییز بين المفحوصين الذین تقع درجاتهم قریباً من درجة القطع بالنسبة 
للاختيار» إذ ان معظم المفحوصين یمیلون للاجابة عن مثل هذه الفقرات إجابة صحيحة. وما 
يقترح من مثل هذه الأمثلة هو المزاوجه بين صعويات الفقرات وقدرات المفحوصين بدلاً من 
الحصول على اجابة كل مفحوص على كل فقرة. وهذا هو هدف الحبك (الاختبارات المكيفة) 
وتقنياً فان استراتيجيات حبك الاختبار تعتمد على مفهوم يعرف ب " المعلومات " وما تبقى من 
هذا الجزء يركز على هذا الفهوم, وللوصول الى فهم افضل لهذا المفهوم افترض الأمثلة 











الآتية: يريد مطور الاختبار بناء اختبار عدد فقراته خمس بهدف تحديد مواقم الفحوصین على 
تدريج السمة الكامنة الذي يمتد من - ۰ الى + ت مع هذا فإن مطور الاختبار يعلم أن 
درجات السمة الكامنة للمفحوصين في عينته تمتد من - 3.00 الى + 3.00 وتتوزع اعتدالياً 
حول نقطة الصفرء افترض أنه من الممكن بناء فقرات لها دالة خطوة للمنحنی المین للفقرة, 
وتتغير هذه النقطة عندما تظهر الخطوة لكل منحنى مميز للفقرة. في المحاولة يعد مطور 
الاختيار خمسة فقرات لكل منها منحنی مميز للفقرة للخطوة عند 0 = صفر. وعند تطبيق 
الاختبار نجد ان 50 % من المفحوصين كانت درجاتهم الكامنة أقل من صفر وأن %50 من 
الفحوصین كانت درجاتهم الكامنة أكبر أو تساوي صفر من الواضح ان هذا الاختبار يزودنا 





جدول (9-15): نتائج اختبار مؤلف من خمس فقرات على تدريج جوتمان 








وفي الحاولة الثانية في بناء الاختبار تظهر خطوات النحنی المیز للفقرة عند النقاط 
- 1.0 , 0, 0.5 , 0.10. والآن تتراوح الدرجات الخام بين صفر و 0.5 ۰ ويبين جدول )9-15( 
نماذج الاستجابة ومواقع الفموصین الذين حصلوا على کل درجة لاحظ أن الاختبار یزودنا 
بمعلومات عن مواقم المفحوصين الذين سمتهم الكامنة آقل من - 1.0 أو آعلی من LO‏ ومع 
ذلك فانه یزودنا بمعلومات جيدة عن مواقم الفحوصی بين - 10 و + LO‏ 

وفي الحاولة الثالثة بنیت الفقرات بخطوات -2, -1, ۸0 +1, +2 وثانية, فإنه لوحظت 


=== 3 

















اتات ee a‏ مها م هی الو شمان سول )0-15( ا 
الاستجابة وللواقم الناظرة لكل درجة ملاحظة. ومن الواضح ان هذا الاختبار يقدم معلومات 
اکثر من الاختبار الثاني لتحدید مواقع الفحوصین في النطقة -3 < 0 < 1.0 و 1.0 << 30 . 
كذلك فانه یزودنا بمعلومات أقل عن تحديد مواقم الفصوصین في المنطقة -1 < 0 < 2,1 
ویکتشف مطور الاختبار الآن المعضلة؛ فمن اجل بناء اختبار مفید في الخطوة الأولى فإنه يجب 
تحدید الواقع على تدریج السمة الكامنة التي تمیز بشکل جید عبر تقاط التدریج والخطوة 
التالية هي بناء اختبار یزودنا بمعلومات تحدد مواقع الفحوصین في هذه الناطق 

من الواضح من الأمثلة السابقة ان الاختبار یزودنا بمعلومات تفاضلية عبر الناطق 
المختلفة على تدریج السمة الكامنة وتمییز افضل یکون عبر الفحوصین بدرجات سمة كامنة 
في الناطق التي يقدم فیها الاختبار معلومات اکبر عبر الناطق الختلفة» وعلاوة على ذلك فإن 
العلومات الستقاة من الاختبار تعتمد على النحنی المیز للفقرة. ولهذا السبب فانه یمکتنا 
الحدیت عن معلومات الفقرة . 

ومع ذلك فان العرض اعلاه يغطي العنی العام للمعلومات» وهذا الفهوم له تعریف رياضي 
دقیق لنوع )6( يأ تمثل الشتقة الأولی للمنحنی المیز للفقرة. وللقاری الذي لیس له معرفة 


جدول )10-15( نتائج اختبار مؤلف من خمس فقرات على تدرج جوتمان 
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السمة الكامنة (8) 


شکل (8-15): توضیح لخطوط الماس على المنحنى المیز للفقرة 

بالعادلات التفاضلية بكفية معرفة ان الشتقة الاولی عند أي قيمة 0 تساوي ميل الخط الرسوم 
عند مماس النحنی المیز للفقرة عند النقطة (0)ي7 . ویبین الشکل(8-15) مثل هذه الماسات» 
ویتبین من الشکل ان ميل النحنی عند ,0و و9 قليل نسبياًء وكذلك قيم الشتقة عند 0 83.9 
پینما ميل الماس عند 02 كبير نسبيأء وکذلك قيمة الشتقة. لندع Qg‏ والعلومات التي تزودنا 
بها الفقرة عند أي نقطة ع على تدريج السمة الكامنة هي: 


P^, (6)]2 
1 Wee _ ی لع‎ (8) 


© 0,0 [(0),ط] 


وبسط العادلة هو الشتقة الاولی 1 (9) IMP,‏ فان العلومات تکون اکبر Leake‏ تکون قيمة 
الشتقة اكد ونتيجة ذلك فان الفقرة في الشکل (15 -8) تزودنا بمعطومات عند 82 اکبر من 
تلك ate‏ ,6 و 89 ۰ ally‏ لان الشتقا الاولی عند 82 اکبر ویمکن حساب العلومات عند کل 
نقطة على تدریج السمة الكامنة. وذلك للحصول على العلومات التي تزودنا بها الفقرة عند كل 
Lag’‏ من قیم 6 sing‏ رسم منحنی (1)0 مع 6 نحصل على ths‏ معلومات BBall‏ ویمثل 
الشكل )15 -9) دوال معلومات الفقرة للفقرات الثلاث للمنحنی المیز للفقرة, للنموذج ثنائي 
العلم. فالفقرات الثلاثة لها قيمة ag‏ نفسها بینما تتغیر قیم ع0 لهاواقل قيمة صعوية للفقرات 
الثلاث by‏ -صفرء ومنحنی معلومات هذه الفقرة هو الابعد الى جهة الیسار» مع ملاحظة أنه 
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يصل الى اعلى قيمة عند 0 - صفرء وهذا يعني ان هذه الفقرة تزودنا بمعلومات اكثر عن 
الفحوصین الذین Lays‏ السمة الکامنة لهم تساوي صفر. Gy‏ انشا ان منحنی معلومات 
الفقرة الأولى یقع دون 0.15 لمن درجة السمة الکامنة لهم اقل من -2.0 وآعلی من 2.0 وهذا 
يعني أن الفقرة تزودنا بمعلومات قليلة عن الفحوصین الذین تقع سمتهم الکامنة في هذه 
المنطقة . 


cola glad 


Information 
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Lateut Trait السمة الكامتة‎ 


شكل )15 -9): توضيح لمنحنى المعلومات لفقرات ثلاث صفر- by‏ ,و وط - 0و 21 b3‏ 

وعند الحصول علی العلومات الحددة يمكننا وصف حبك الاختبار بصورة مفصلة» dala‏ 
يوساطة الحاسوب» fasio‏ الطريقة بتقدم كل مفحوص gl‏ عدة فقرأت. وتستخدم استجاباتهم 
في تكوين تقدير أولي لدرجة السمة الكامنة للمفحوص, وبعدها يقدم الحاسوب الفقرة التي 
تعطينا اكبر قدر من المعلومات عند درجة السمة الكامنة والمساوية لقدرة المفحوص الكامنة 
المحسوية فى اليدايةء واعتمادا على درجة السمة الكامنة المستنيطة من الفقرة تقدم له فقرة 
جديدةء وأحد قواعد انتهاء الاختبار بهذه الطريقة هو تحديد محك دقيق لتقدير السمة الكامنة, 
ويستمر الاختيار حتى نحصل على تقدير دقيق للسمة الكامنة. 
المعلومات التي تقدمها طرائق الاختبار والتصحیح المختلفة 

أثيت مفهوم المعلومات اهميته عند: 

2. مقارنة اختبارات مختلفة تقيس السمة نفسها 








3. مقارنة طرائق الاختبار الختلفة مث الاختبارات المحبوكة والمقننة التقليدية. وعند اجراء 
T‏ هذه اقا رات هاما تسعتيم دوا مرا LGA‏ وتات تسس ادا 
سعدا هذة الحو يت هه الال 

tane دون توبات الق اكرات تیان‎ ENE 

ویالرموز هي: 


A915). 2 (6)ي1‎ = 1)8( 


طريقة تصحيح معينة والعلومات التي يزودنا بهاء لذا فمن المناسب التمييز بين المعلومات التي 
tyes‏ بها طريقة سمحي ees‏ وا لعلرشات القن دو الاختبار, وسكرسن الى clobha‏ 
التصحيح بالرمز IO, x)‏ وذلك لاي صيغة طريقة تصحيح معينة والعلومات التي یزودنا 
مستخدمة: ویمکننا أن نبين أن DO)‏ ,8) 1 ,اي الحد الاعلی للمعلومات التي نحصل عليها من 
التصحيح. إن ابسط صيغة التصحيح هي اعطاء درجة واحدة لكل اجابة صحيحة وصفر لكل 
PLT‏ ن تفن عق فده الاخ يده على انش 


N | > Ug=X 


وترمز Ug‏ الى درجة الفقرة 8 التي قد تكون صفر أو واحد. وقد بیّن بیرنباوم (Birnbaum,‏ 
)1968 ان صيغة التصحيح هذه للنموذج احادي المعلم تؤدي الى اقصى قدر من المعلومات 
يمكن الحصول عليها وينسحب هذا على الاختبارات التي لفقراتها جميعاً الصيغة نفسها 
للمنحنی المیز للفقرة years‏ النظر عن صيغته. وللنموذج ثنائي المعلم تكون صيفة التصحيح 
× = ولا âg‏ ,2, وهذه ينتج عنها اکبر دالة معلومات ویمکتنا ان نبين ولاي تموذج أنه لا یمکننا 
الحصول على (0) 1 لقیم 0 جمیعها بأي صيغة تصحیح وذلك بسبب: 

1. الجمع الوزون لدرجات الفقرات 

2 واستخدام الاوزان نفسها للمفحوصین جمیعهم. فمثلاً استخدام الاوزان الآتية مع 

النموذج اللوغاريتمي ثلاثي العلم: 
D,, [Pg (0)- Cy]‏ 
E ere Wa‏ 
[I- Cy] P.(8)‏ 

ينتج عنه منحنى معلومات مساویا لمنحنى معلومات الاختبار لقيم 0 جميعهاء وهذه الاوزان 

تعتمد على (0)0؛ لذا فان هذه الاوزان تختلف باختلاف المفحوصين. 
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والسؤال المهم یکمن في فقدان العلومات عندما لا يستخدم نظام الاوزان الثالي كصيغة 
معتمدة في التصحيح. ففي حالة النموذج ثنائي المعلم على سبيل المثال السؤال المهم هو نقص 
العلومات عند استخدام الصيغة و u‏ = × للتصحيح بدلاً من الصيغة X agu gtg = =y‏ ويمكن 
اختبار هذا السوّال في الفقرة التالية من خلال مفهوم الفعالية النسبية . 

افترض ان × و ل تمثلان قیاسین مختلفین للسمة نفسهاء فقد تکون ‏ و لا طریقتین 
مختلفتین في تصحیح الاختبار نفسه أو انها درجات مشتقة مشتقة من اختبارات مختلفة تقیس 
السمة الکامنة نفسها . وتتحدد دالة الفعالية النسيية للقياسين ب: 

1(@,x) 


)22-135( سد سمس سس م40‎ REO, x,y) 
0)آ1‎ ,( 5 


الکامنة وتشیر الى اي القیاسین يعد الافضل لقياس السمة الكامنة عند كل انقطة 4 
qa‏ ولأي درجة سمة كامنة عندما تكون RE OXY)‏ >1 فإن X‏ يكون قياس افضل, 
ويصورة مشابهة عندما تكون درجة ألسيمة الكامنة (ل,:,0) RE‏ > 1 فان ۷ يكون قياس 
أفضل للسمة الكامنة. 

نظام آوزان مثالي للفقرات. فعلی سبیل المثال يطرح سؤال حول ققدان العلومات عند 
استخدام صيغة التصحيح =y‏ هنا < بدلاً من الصيغة agty=y‏ 8 وهنا تتحدد الفعالية 
النسبية بالصيغة لکد واشار بيريتاوم الى هذه الصيقة الخاصة لدالة الفعالية النسبية 
على انها دالة الفعالية. وحیث ان Wall‏ هى(× ,100 < (0) 1 فإن قيمة دالة الفعالية تکون آقل 
أى تساوي 1. ووجد هامیلتون وتراوب )1971 , (Hambelton & Tranb‏ ان دالة الفعالية غير 
اموزونة للنموذج ثنائي الم تكون أكبر من 0.85 ' ويمكن تفسيرها لتعني ان طول الاختبار 
Mads Ma eT SEE‏ ۳ 0 مشاه متفه 
التصميح غير الوزونة تكافئ اختزال طول الاختبار بنسبة 100 )%85.0-1( (اي #15) 
عند الحم لاوزان المثالية. ودين 99 0 ان ae‏ الصيغة 00 = Me Ug‏ 2 
۷ التخقضة. 
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وتستخدم الفعالية النسبية ايضاً لقارنة الاختبارات القننة التقليدية بالاختبارات المكيفة 
(الحبوکة). وکما هو ملاحظ فان الاختبارات الكيفة هي احدی الطرائق التبعة في الزاوجة بين 
صعوبة الفقرات ومستوی قدرة الفحوصین, ویفضل هذا الاسلوب الاختباري لان الفقرات 
الصعبة loo‏ والسهلة بهذا تزودنا. بمعلومات UE‏ عن مستوی القدرة الكامنة للمفحوصب. 
وقد وصف لورد )1980 , (lord‏ ثلاثة انواع مختلفة من الاختبارات المكيفة. احدها الاختبار مرن 
الستوی الذي یتلف من فقرات كرفي وفق صعویتها وید الفحوص بالاجابة عن فقرات 
مكودتطة الطنعوية. وان yc WR‏ ا شمه بطر على التجومی دقرا کف 
oles Ny liga‏ اقل عى عة الحا القاطئة Last?‏ ونان لورد 06415707 کف 
ترتیب الفقرات قي کتیب الاختبار إن تجمع الفقرات وفق تقدیمها المفعوض في الاختبار مون 
الستوی. ویمکن اجراء مقارنة افتراضية بين اختبار مرن الستوی وآخر تقليدي وذلك بتحدید 
gall att alla‏ لكل 605 وتا تك او عط EA all‏ وحسات KE‏ 
Racal‏ وعدن الا ان فرح الا الكابدة aU‏ تن الى نکن وان ار 
من معلومات الاختبار التقلیدی فى يمن متاق رع Tanal‏ لكام Way‏ تشاع دفن 
التأشير على الاهداف التقبيمية التي یتمیز بها الاختبار مرن الستوی على الاختبار التقليدي. 
وبالتغییر النتظم لعالم الفقرة يمكننا تحدید القانون تجريبياً لتصميم اختبار مرن الستوی 
اکثر فاعلية وتتالف هذه القوانین التجريبية من قيم مناسبة محددة لعالم الفقرة. وإذا افترضنا 
ا مرف او همق لمكن يناك اختبار اند تكريكية مرنة وين آلهم جار ع 
مثل هذه الاختبارات من اجل فحص طرائق تطبیق الاختبارات مرنة الستوی مع مفحوصین 


ویمکن استخدام الطرائق الشابهة لهذه والوصوفة في الاختبارات مرنة الستوی في 
تطوير قواعد تصمیم الاختبارات ثنائية الرحلة والاختبارات الحبوكة. یتالف الاختبار ثنائي 
الرحلة من اختبار تمهيدي قصير وعدة اختبارات اطول (اختبارات الرحلة الثانیة). إذ 
تستخدم درجة القحوص. على الاختبار التمهيدي في تحدید اختبار الستوی الثاني الذي 
سیتقدم اليه الفحوص وتقترح النتائج التي عرضها لورد )1980( انه بالامکان بناء اختبارات 
ثنائية الرحلة واخری محبوكة تزودنا بمعلومات اكثر عند مستویات القدرة الختلفة مما تزودنا 
به الاختبارات التقليدية. 

وأخيراً من الضروري تمييز ان نظرية الاستجابة للفقرة والفاهیم الرتبطة بالعلومات 
والفعالية النسبية يمكن تطبیقها في مقارنة اختبارات لم تبنی بالاساس وفق نماذج السمة 
الکامنة فعلی سبیل المثال لخص لورد دراسة تقارن بين سبعة اختبارات لفظية للصف 
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السادس باستخدام الفعالية النسبية. وبینت النتائج انه في الاختبارات التتابعة للتقدم 
التربوي (step)‏ السلسلة الثانية والمستوى الرابع للصيغة - 1 - اي الاختبار الفرعي في 
القرامة مقارنة باختبار میتروپولیتان التحصيلي (MAT)‏ للمستوى المتوسط - الصيغة - و -. 
ان pay STEPA‏ معلومات اکثر عن القثة متدنية التحصیل بنسبة 20 % من اختبار 
MAT‏ وللطلبة من الفتات الاخری فان MAT LOA‏ بقدم معلومات اکثر من اختبار STEP‏ 
وتشیر مثل هذه الدراسات الى قدرة نظرية الاستجابة للفقرة فى صنم قرارات تتعلق بملائمة 
الاختبارات بغض النظر ge‏ الطريقة الاساسية العتمدة في تطویر الاختبار . 
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تمارين : 

1 اعتماداً علی الشکل )3-15( of ons‏ الفقرتین الاولی والرابعة مستقلة مسحلیاً 
للمفحوصين الذين درجة السمة الكامنة لهم 92 . وييّن أن لفقرتین الثانية والثالثة 
مستقلة ويين أن احصائيأعند أي درجة سمة كامنة في الدی 02> 0< و0. 

2/ افترض أن بيانات اختبار طابقت النموذج اللوغاريتمي ثنائي المعلم. لاول فقرتين )8( 
رط = 0.5 ,(22)0 = 0.7 لدرجة سمة كامنة dines‏ بالاضافة لهاتين الفقرتين = 0.45 
=P )- , + 1/0( , P (+ , + 1/0)‏ 0.05 و )1/0 -,-( =P‏ 0.25 فهل تقترح fie‏ هذه 
النتائج احادية البعد ؟ لماذا نعم؟ ولماذا لا؟ 


73 قيما بات اقباظ E E‏ اکا على سس فق ات 





| 
; 


0 تسس سس‎ conan tae? 


هل تنسجم انماط الاستجابة هذه مع الادعاء بان هذه الفقرات احادية البعد وان النحنیات 
الميزة للفقرة هي دوال خطوة وان كان كذلك فارسم المنحنيات المميزة للفقرات الخمس . 

4 تبين النتائج التالية معامل بايسيريال للفقرة - السمة الكامنة Py‏ وصعوية الفقرة Py‏ 
لاربع فقرات بافتراض التوزيع الطبيعي للقدرة 0 لاربم فقرات, بافتراض لتوزيع 
الطبيعي للقدرة 0 بمتوسط صفر وانحراف معياري 1. احسب Ag‏ و Dy‏ لكل فقرة. 

les‏ اساس هذه النتائج هل Py‏ تعاني من قصور كمقياس لصعوية الفقرة؟ 



































5 تتضمن الجداول التالية معلومات متوقعة لمخرجات برنامج بيكال لخمس عشر فقرة. 
و 474 مفحوص طبقت عليهم الفقرات لمعايرة كل من صعويات الفقرات ومعالم قدرة 













مدى الدرجات 7-1 8-8 9.9 10-0 11-11 14-12 
متوسط القدرة 0.50- 0.19 0.55 0.92 133 2.05 
التوسط الزائي 0.1 0.1 02 03 06 06 
al aa‏ العياري (بالدرجات الزائ ۰ 2.1 15 و0 14 14 13 
77 65 85 80 71 96 


suc‏ افراد الجموعة 
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أت BIG sus‏ فقرات gui‏ انماط استجابة الفحوصین آن مطابقتها ضعيفة للنموذج ؟ والی 
ماذا يعون غیاب الطابقة. 

ب- على متصل واحد. وباستخدام البیانات في الجدول لجموعات القدرة الست ارسم 
النحنی المیز للفقرات 1, 2, 3. 4. على التواليء ثم ارسم النقاط الستة لكل فقرة مبيناً 
ky ke et‏ عق ats‏ القدرة هذه الذين (alt‏ اة 
صحيحة باستخدام التصل نفسه. وحدد لكل فقرة منطقة القدرة التي ينحرف الأداء 
عليها بشكل واضح عن الاداء المتوقع . 

ج- رتب الفقرات ol‏ 3 4, بدلالة صعوياتها اعتماداً على ملاحظاتك لمواقعها على المتصل 
المرسوم في النقطة ب. 





eee‏ و ot‏ تظر a‏ الات 








د- حصل الفحوص ١‏ علی درجة خام 10 في الاختبار وحصل الفحوص ب على 11 
نقطة ما تقدیر الدرجة الحقيقية للحسوبة لكل منهما 

G76‏ تین ادناه المفلوماف (( 66 ال واا تیان مومع 9 قرات غد 
النقاط التسعة على تدریج السمة الکامنة ولکل فقرة منها ay‏ -5 0 بینما Dy pad‏ 
رازم بخ 20 الى 20 Oy‏ مسبت JIRA‏ العلممسات لذالة التمت ود 
اللوغاريتمي ثنائي العلم. وقد تم الحصول على نتائج مشابهة جداً بوساطة النموذج 
الطبيعي استخدم اشکال العلومات لحساب کل من: 


E Ea Û‏ نيا CERN‏ نوت من clea‏ الك مساق 
مغلومات الاختبار لقیم السمة الكامتة Teall‏ فى الول 

ب ) معلومات الاختبار التي یزودنا بها الاختبار التضمن الفقرات التسع. عند NS Ray‏ 
by‏ = صفر 5 





cue /7‏ الجدول ادتاه معلومات الاختبار لاربعة اختبارات عند تسم نقاط علی تدریج 
السمة الكامنة. في الاختبارین الاول والخاني كانت قيمة ag‏ للفقر ات جمیعها = 1.0, 
بینما كانت قیمتها في الاختبارین الثالث والرابم = 1.5 ولکل زوج من الاختبارات 
الاولی قیم یط لها هي مثل قيم وط للفقرات التسم في الفرع الاول )1( من السژال 
السادس, بینما الثاني یتالف من تسم فقرات لكل منها dg‏ صفر. cling‏ على هذه 


== 5 = 
































النتائج واجابتك على سؤال 6 ويافتراض عدم الاهتمام بدقة قياس المفحوصين عند 

8< -2.0 أو 0 > 2.0 فماذا a coe‏ لقند ارات بمدى صعوية آوسم 

في الاختبار؟ وفي اجابتك على هذا السؤال افترض ان الفق رات التي لها 
<a, l‏ 1.0 نادرة وان الفقرة التي لها a,‏ = 1.0 لها تقري Ly‏ معامل ارتباط بایسیریال مع 
السمة الكامنة = 8.0 وللفقرات التي لها ag‏ = 0.5 و 1.5 لها معاملات ارتباط 
بايسيريال مناظرة 0.45 0.83. 











ملف فقراته مدرجة على تدريج مشترك وطابقت بياناتها نموذج السمة الكامنة 
۱ اللوغاريتمي ثنائي المعلم لكلا الاختبارين المنتظم والتجريبي» واختير التدريج بحيث 
یکون متوسط السمة الکامنة صفر وانحرافها العياري 1. كيف يمكن استخدام هذه 
النتائج في تحدید مواقع الفقرات التجريبية المحسوية معالها على التدریج نفسه التي 
l‏ تقع عليه معالم الفقرات النتظمة. 
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ANEETA ANS 





سج احور ENS EONS‏ بو VS‏ ها و لل رم LEROY‏ ع هو ملت ةر لبلب لت دوا فر 


























الکشف عن تحيز الفقرة 
من المسلم به أن درجات الاختبار تتأثر بمصادر التباين إضافة إلى البناء الذي يقيسه 
الاختبار. وان لم يكن هذا حقيقياًء فان درجات الاختبار ستكون صادقة وثابتة تماماًء ولان 
مصادر التباين التى ليست ذات علاقة لا يمكن إلغاؤهاء فمن الهم أن لا تكون متحيزة ضد 


. إذا كان ضمن مجموعة من المفحوصين الذين لهم نفس الموقع على متصل السمة التي يقيسها 


Ley‏ كلك قاس توت معان ان غير الناسية مقر اويقاف ل ين الدب عقي 
الفرعيتين. ولفهم كيفية ظهور مثل هذاء خذ بعين الاعتبار المواقف الآتية: 
اغا فق tata‏ قور الققياو دكا E‏ فرع هذ اتسوا ما یی تیه إذا 
Sle ae‏ تملظ حون دون كص cleat‏ فى يقر ا 8 ا ا 
هی الاخبار Ge‏ ذلك :إلى الموظف السوول عن alld‏ فی الخزن. يقال ان She‏ هذه الفقرة 
قد تکون متحيزة ضد الأطفال ذات الدخل التدنی, إن آن SAT‏ الال إلى الوالدین قد 
yas‏ إجابة آو 845 فغل ملحوظة عند مثل هولاء JULY‏ اكش من غيرهم. 
1 قد تطلب فقرة في اختبار مفهوم الذات من الطلبة الإجابة على تدریج لیکرت على 
العبارة: "أن بشرتي لها مظهر from‏ وثانية قد يقال عن مثل هذه الفقرة آنها متحيزة 
اذا تيا دى مخت ی الرامقي این SSF‏ مها اون AE Go Val‏ 
التشابهة قد لا تژثر على مواقف متشابهة على سمة الاهتمام. 
Gaal las) bana 2‏ فقول "دی kg aA yea, Cally‏ اناد 
يكلفه 0.25 دولار, فكم علبة يمكن شراؤها؟" فإن كانت هذه الفقرة تطبق على أطفال لا 
يستطيعون قراءة الإنجليزية ضمن مجموعة الأطفال الكليةء فان مثل هذه الفقرة تقيس 
مهارات مختلفة لأطفال خاضعين لموقف اختباري واحد. 


إن هنالك فكرتين أساسيتين من هذه النقاشات حول تحیز الفقرة: 


الاولی: هى أن آداء الأفراد الخاضعين للاختبار على الفقرة قد يتأثروا بمصادر تباين غير 
تلك المتعلقة باليناء المقيس. 
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الكانية: هو أن هذه الصادر الإضافية للتباین تؤثر على الاداء بطريقة مغايرة وبشکل منتظم 
لبعض الجموعات الفرعية من الجموعة الكلية التي خضعت للاختبار. ومن الممكن أيضاً تأثر 
ترجا ت المجتنهات المرغية هار الشنايق SMe PARA‏ على إن call‏ الذي تكن فيه 
alt‏ هة ف مات قرع LE‏ وق لا كرون العصو داهضا هى خلذل عملية 
فحص محتوى الفقرة. فعلى سبيل المثال: قد يكون للأفراد المفحوصين من مجتمع فرعي معين 
في بعض المواقف أداء أفضل على الفقرات التي تم الحكم عليها من قبل مراجعي المحتوى 
وصنفت على أنها فقرة متحيزة ضد هذه الفئة من المفحوصين AST‏ من الققرات التي صنفت 
على Lal‏ غير متحيزة. لذا فإن مطور الاختبار آو مستخدمه الذي برغب ببحث واکتشاف 
الفقرات التحيزة شين مجمؤمات هیا يحب عليه أحراء دز امه tugs‏ على الفقزات gill‏ 
يعتقد الباحث تحيزها. ش ۱ 


وهنالك هدفان للدراسات التي تبحث في تحيز الفقرات: 

الأول بحث ما إذا کانت درجات الاختبار تتاثر بمصادر التباین الختلفة فى الجتمعات 
الفرعية كافة. وإذا كم على درجات الاختبار للمجتمعات Le yall‏ كافة آنها تتأثر بمصادر 
التباین نفسها. فإن الهدف الثاني هو تحدید ما إذا كانت آي من هذه الصادر غير ذات 
العلاقة تعطي أي ميزة متحيزة لبعض الجتمعات الفرعية. ومن خلال هذين الهدفين یمکننا 
صياغة تعریف للفقرات غير التحيزة على آنها: 

1. تتآثر بمصادر التباین نفسها في كلا المجتمعين الفرعیین. . 

قن ار eee‏ دهم ESS pada ll)‏ تن jas Gal all palin‏ نات 

العلاقة هو نفسه لكلا الجموعتین الفرعیتین. 

ویهتم هذا الفصل بطرائق بحث واکتشاف تحيز الفقرات. لن نحاول مناقشة الطرائق 
يها رقنا مدا las)‏ شیوعا راغ فى سمال راسا یز الفقرانت,توقد قد 
جنس (Jensen,1981)‏ عرضاً شاملاً لهذه الطرائق. وسنناقش BIE‏ فئات من هذه الطرائق: 
نظرية السمة الكامنة ومربع كاي وصعوية الفقرة. ولم تجري أي محاولة لتقديم التفاصيل 
الإجرائية الكاملة لهذه الطرائق, إلا أنه تم ذكر مصادر للمهتمين بتفاصیل هذه الإجراءات. 
وعند عرض اي من هذه الطرائق ستجري مقارنة بن مجتمعین فرعیین ولکن هذه الطرائق 
تستخدم للمقارنة بين ASÍ‏ من مجموعتین. 


الطرائق العتمدة على نظرية الاستحاية للفشرة: 
عند استخدام نظرية الاستجابة للفقرة للتحقق من تحیز الفقرات. فانه يتم الحکم على 
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الفقرات بأنها غير متحيزة إذا كانت النحنیات المميزة للفقرات (ICC)‏ هو نفسه لكلا 
المجتمعين الفرعيين. ومن ثم فإن صعوية الفقرات تكون متساوية لأفراد المجتمعين 0 
ويهذا فان مصادر التباين غير ذات العلاقة تؤثر على المجتمعين الفرعيين بالطريقة 
إضافة إلى cell‏ بما أن المنهنيات S‏ ا ee‏ ۹ 
متحيزة على وفق تعريف نظرية السمة الكامنة فستكون غير متحيزة وفقاً للتعريف المقدم آنفاً. 
المتجانسين في السمة الكامنة هم أيضاً متجانسين في البناء الذي نهتم بهء فان كان الأفراد 
التجانسین على السمة الکامنة غير متجانسين على البناء الذي نهتم به. فان الاختبار ليس له 
صدق بناء آساسي. واستخدام الاختیار الشکوك في صدق بنائه یمائل إجراء دراسة ols‏ 
لاختبارات مشکوك في صدقها. فان كلا الفعاليتين لا قيمة لهما). والفقرات التحیزة وفقاً 
لتعریف فظرية السسما الکامنة قد لا تکون متحيزة Lady‏ لتعريفنا هذا . ووسنناقش هذه القضية 
بتفصیل آکثر في نهاية هذا الفصل. ویوضح الشکل (16 -1) فقرة لا یتساوی النحنی المیز 
لها لجتمعین فرعیین. 

ولأن النحنیات الميزة لجموعة فقرات غير متحيزة لا تتباین عبر الجموعات الفرعية فان 
معظم العاملات التي تعتمد على نظرية السمة الکامنة تعد قیاسا لدی تباین النحنیات الميزة 
الفقرة للفقرات جمیعها 














ae 8 12 16 20 


شكل (16-1): توضيح لفقرة لا يتساوى المنحنى المميز لها مجتمعين فرعيين. 
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تدريج معامل الفقرة: 

قبل هساك طاول کمن الق دی کات ماک الهش الوم شب لكل مه 
فرعي. . احدى الطرق الناسبة للحساب هو تقیید تقدیرات (Dg)‏ بحیث یکون متوسطها (صفر) 
وانحرافها العياري (واحد) )1990 (LORD‏ وهذا یعرف باسم معايرة قیم (9 ی 2), وآلياً يتم 
تحدید مواقم العالم الحسوبة علی التدریج نفسه لکلا الجسوفتین: وتصلم هذه الطريق 
للنماج اللوخاريتمية DIAM‏ ولنموذج النحنی الطبيمي (وفي حالة التموذج احادي العلم من 
الضروري فقط التقید بمستوی صعوية = صفر فقط). 

RA‏ باه شیم let tall‏ ی رسای رات EE‏ رون هذ 
الطريقة يتم تدریج قيم السمة الكامنة الحسوپة بشکل منفصل لكل مجموعة فرعية. ولکل 
مجموعة فرعية یکون متوسط السمة الکامنة صفر وانحرافها العياري واحد. ویما أن تدریج 
E aa‏ مق اک موم الک کزان كدري هات IL tall‏ زاس 
المکن تحویل قیم الصعوية والتمییز للمجموعة الفرعية )1( لتصبح على تدریج الجموعة 
ae, alt‏ الثانية, وك باستخدام الاين 


E EEES m+ Kbjp = big 
aig ١ 
ا‎ eee aE ak 


وفي كلا العادلتین تمثل Aig‏ و Dig‏ قيم الجموعة الفرعية الناتجة عن معايرة 0» وقيم 0 و 
1 و1 هي ثوابت تحسب على النحو البین آدناه. وقیم alg‏ و Dig‏ تكون على تدریسج 
azg‏ و bag‏ نفسه. أي الحسابات التي حصلنا علیها للمجموعة 2 والناتجة عن معايرة 9. 
دیمکن حساب قينا K‏ بحساب میل التحنی البياني by cell‏ مقابل م 5 ویحسب النجنی 
والقاطع لهذا الخط البياني كما يأتي 


(2-16) ........... 2020 Py 4 + (2 6; ~ و2‎ + (20; — 20) = k 


A 


و 18 = رو - ease bık‏ ی (1-16ب) 


وقي العادلة )12-16( تمثل 021 التباین عبر الفقرات ي "0ء بینما O92 fia‏ التباین عبر 
الفقرات bo" g‏ ويمثل وب الارتباط عير الفقرات g‏ "0 و wd bo" g‏ العادلة (2-16ب) تمثل تمتل 
by‏ و bo‏ التوسطات الفقرات bag‏ و bi's‏ على التوالي. (وقد أشأر إبرونسون-1202) 
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Gison,1982)‏ هذا الإجراء لحساب k‏ و M‏ غير مقنع تماما وقد ناقش بحثاً كاملاً لتحسينها). 
وهذه الطريقة تعمل مع النماذج احادية المعلم والثنائية وكذلك ثلاثية المعلم. فللنموذج أحادي 
المعلم 20 -1 ويجب ملاحظة أن المعلم cy‏ معلم شبه الصدفة أو التخمين لا يتأثر بتغير 
التدريج ولا داعي لعادلة قيم Cg‏ لكلا المجتمعين الفرعيين. 
مقارنة المنحنيات المميزة للفقرات: 

ما إن يتم التعبير عن قيم المعالم على التدريج نفسه. فإنه تجري مباشرة مقارنة المنحنيات 
المميزة للفقرات لكلا المجموعتين. وهنالك طرائق عدة للمقارنة Lard‏ بينها. وياستخدام النموذج 
اللوغاريتمي ثلاني المعلم اقترح لورد )1980 (Lord,‏ اختبار الفرضية الصفرية Gly‏ يه = يده 
و ور = -bag‏ ويجب ملاحظة أن هذا الاختبار مرتبط بطريقة حساب ومعايرة by’s‏ لکلا 
الجموعتین. ولصعوية تقدیر Cg‏ بدقة فانها مستثناة من هذا الاختبار. وهذا الاختبار يتم 
إجراؤه للفقرات جميعهاء وهذا يژدي إلى إحصائي مريع كاي والذي یستخدم في اختبار 
الفرضية الصفرية. وتعد كل فقرة يتم رفضها باختبار الفرضية الصفرية فقرة متميزةء وتعد 
قيم إحصائي مربع كاي مقياساً لدرجة تحيز الفقرة. وقد قام لورد )1980 (Lord,‏ بتطوير 
اختبار باستخدام النموذج ثلاثي العلم. ويمكن استخدام اختبار مشابه في حالة النموذج 
ثنائي المعلم. ويمكن اختبار الفرضية الصفرية للنموذج أحادي المعلم m‏ 


Dog - Dig 


A A 
O1 gt و02‎ ۳ 


حيث تمثل ي رو۵ الخطأ العياري لصعوبة الفقرة. للفقرة g‏ وللمجموعة ‏ والقيمة الحرجة 
ل 20/7 هی المئين 0-1(100/ 2( للتوزيع العياري الطبيعي. 
واقترح روندر (Runder,1977)‏ حساب الساحة بين (ICC’s)‏ للمجموعتین الفرعیتین 
کمقیاس للفرق بين (ICC's) pando‏ الاثنين» ویمکن تقریب هذه الساحة باستخدام العادلة: 
00-0 4 


(3-16)... | P24(0) - (0)و:۳‎ | 0.005 ۹ =A 


00-9 E 


وفي المعادلة )3-16( تشير كل من (0)مو۳ و PaglO)‏ إلى قيمة (ICC's)‏ لكلا المجموعتين 
الفرعيتين. ويمكن حساب قيمة (0)ي21 لكل قيمة O‏ من (-4.00 إلى + 4.00) في خطوات 
تباینها 0.005 لكل مرة باستخدام العادلة (3-16): 








4,00=6 
Cal) ی‎ ‘PPog(8)-Pyg(®) [0.005 K = هي (باشارتها)‎ 
4.00--8 


والتي تزدي إلى قیاس مساحة باشارة (تحمل oll RL]‏ آن الفرق العددي بين القیاس 
الذي يحمل إشارة والذي لا يحمل إشارة یظهر عندما يتقاطع النحنیان المیزان للفقرتین كما 
في شکل (1-16). ولأن إشارة القيمة الطلقة في العادلة )3-16( تحوّل القیم السالبة ل 
(0)پرر۳- ( 0و۳ إلى قيم موجبة, فان الفروق الناتجة في العادلة (3-16) تكون جميعها 
موجبة6 بینما العادلة (4-16) لا تحول القيم السالية إلى قيم موجبة لذا فان الفروق الموجية 
والسالبة یتم موازنتها إلى ser‏ ماء وقیم الساحات القاسة التي لا تحمل [شارة تکون اكب من 
تلك التي تحمل |شارة. وكنتيجة فإن الفقرات التي لها نفس ICC's)‏ والفقرات التي لها فروق 
موزونة تماماً وتحمل إشارة تؤدي إلى Ag‏ (بإشارة) = صفرء ویبدو أن هذا غير مرغوب به 
حتى إذا تم موازنة الفروق فإن الفقرات تبقى متحيزة. 

وكبديل لمقياس المساحة عند روندر اقترح لين وزملاؤه (Linn, etal,1981)‏ إحصائي متوسط 
مریم تحيز الفقرة دالة ل [(0)ه21 - [Po9(8)‏ 2 الممسحوبة من 20 -3 إلى 0= 3 ويمكن 
اشتخدام علا من الستیغتین ال وغیر الوزونة الا آن الاحضانی آلوزون یکون فقنیزه JS)‏ 
دقة. وتجد تفاصیل هذه الطريقة فی(612[,1981 (Linn,‏ وآبحاث اکفر حدالة للاحصائی 
الوزون تجدها 3 (Levine,1981)‏ وفي (Wardrop& Levin& Linn,1982)‏ ۱ 


أي من معاملات تحیز الفقرة هو الاکثر ملائمة؟ فهل من الأفضل تدوین الاحصائي الذي 
طوره لورد لاختبار Dag = big‏ و pl agg = ag‏ قياس الساحة مثل تلك التي طورها روندر أو 
لين وزملاؤه؟ وعلى الرغم من أن محكاً آخر آثبت أنه Lage‏ في عملية الاختيار إلا أن(10©:”9) 
لها دلالة معنوية Libido‏ تماماً وتبقی بصورة چوهرية هی سن ]1981 فاق رومز فعلی 
سبیل الثال إذا كانت by ,1- ay‏ = 3.5 و © = 02 في الجموعة الأولى» في حين كانت ag‏ 
bg 0.5 =‏ -5.0, و =Cg‏ 02 في المجموعة ASL‏ فإن قيمة (۲(»)0 - Prg(8)‏ لن تكون 
أكبر من 0.5 لاي قيمة (0) بين (-3.0, و 3.0). وفي هذه الحالة الفرق الأكبر في المعلم قد 
يكون مؤشر مضلل للتحيز. وییدو أن هذه الحقيقة تفضل أسلوب روندر ولين وزملاؤه على 
طريقة لورد. 


متال يستخدم نظرية الاستحابة للفقرة: 
لتوضيح استخدام نظرية الاستجابة للفقرة في اختبار تحيز الفقرات تم تحليل استجابات 
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عينة تألفت من )300( مفحوص )150 ذكور و 150 إناثا) آجابوا على 10 فقرات. ويبين 
الجدول (1-16) تقديرات لمعالم الصعوبة والتمييز في نموذج المنحنى الطبيعي لعينتي الذكور 
معامل ارتباط بونيت بايسيريال بين الدرجة الكلية ودرجة الفقرة ل (Py)‏ وحساب نسية الإجاية 
الصحيحة لصعوية الفقرة. (وقد استخدم هذا الإجراء لأهداف توضيحية فقط, ويمكن 

وقد نم الحصول على قيم "زا و aye‏ التي تصف عينة الذكور من خلال المعايرة على (0) 
الذكور. أما قيم bog‏ و ang‏ التي تصف عينة الإناث فقد تم الحصول عليها من خلال المعايرة 
على (0) الاناث. Lay‏ أن التقديرات المعلمية للذكور والإناث ممثلة على تدريجات مختلفة, فلا 
يجوز مقارنتها مباشرة. ولكي نتمكن من مقارنتها يجب تحويل a"1g)‏ و *ج01) بتطبيق 
المعادلتين )11-16( و (1-16ب)ء والذي يتطلب حساب قيم (K)‏ و (M)‏ ويبين الجدول (1-16) 
قیم by)‏ ,2 , و , 02, Ppp‏ الضرورية لحساب كل من my Kk‏ وبالتمویض بالعادلة (-2 
16( نحصل على: 


,ب )1.055 -1.343( + )1.055 - 1.343( + 4 )0.769 )2 )1.055( )1.343( 


(1.158) (1.027) (0.769) 2 =e 


0.798 = 
0222 = (1.513-) (0.798) - 0.985 = m 

وبالتعویض لقيم k‏ و M‏ في المعادلتين )11-16( و (1-16ب) نحصل على: 
هرطع by g=798‏ + 0.222 

als 


A 


= aig 





198 











جدول (1-16): تقديرات الصعوية والتمییز لعينات الذکور والاناث. 





وذلك لتحويل تدريج الذكور إلى تدريج الإناث 

ويدون جدول )2-16( قيم Dig‏ و م2 التي تم الحصول عليها من المعادلتين (11-16) و 
(1-16ب). وكذلك (bog)‏ و (ahg)‏ و ag‏ "أي مقياس المساحة لروندر" لتحيز الفقرة. وكانت 
مساحة التحيز الأكبر للفقرة (1) بينما كانت أقل مساحة للتحيز للفقرة 7. ولغاية الآن ونتيجة 
للتجربة لا يوجد دليل أو محك لتقرير متى تكون الفقرة متحيزةء ویبدو أن الإجراء العام هو. 
فحص الفقرات ذات درجة التحيز الكبيرة نسبياً. ومحاولة إعادة GUS‏ هذه الفقرات لإزالة 
تحيزهاء ويهكذا أسلوب نجد أن الفقرات (1و5) وربما )3( لها clays‏ تحيز كبيرة. 


== 5 : 





























لقد أكدنا کر لاود النحنيات المميزة للفقرات للم جتمعات الفرعية فإن هذه الفقرات 
تكون غير متحيزة على وفق تعريف نظرية السمة Lay gil Sees‏ ضمنياً في 
دراسات تحيز الفقرة. كذلك فإن الفقرات التهيزة وفقاً لتعريف نظرية السمة الكامنة ليس 
شرطاً أن تكون متحيزة وفقاً لتعريف آخر للتحيز. وكما بين هنتر (Hunter,1975)‏ أن تطابق 
بيانات الفقرات مع النموذج أحادي البعد في نظرية السمة الكامنة في حالة كون مجموعة 
الفقرات متعددة الأبعاد يؤدي إلى تغير قيم المعالم عبر الجموعات الفرعية المختلفة. لذلك فإنه 
عندما تتغير المنحنيات المميزة للفقرات للنموذج أحادي البعد (في نظرية السمة الكامنة) عبر 
الجموعات القرعية قفد يؤشر هذا إلى أن ail‏ متمديدة الأبغاف: ومن وجهة نظركا فان 
تعدد الأيعاد لا يؤكد التحيز عندما تکون : 

1. السمات الكامنة الأخرى لا علاقة لها باليناء الذي يتم قياسه. 

2 توزيع هذه السمات مختلف بين المجموعات الفرعية. 


لذا فإن تباين المنهنيات المميزة للفقرات لا یکد بالضرورة تحيز الفقرات. 


حدول (2-16): قياس المساحة (Ag)‏ لتحيز الفقرة. 











أما السبب الثاني لتباين المنحنيات المميزة of Ball‏ فقد يكون لقياس سنمات كامنة أحادية 
البعد مختلفة لكلا المجتمعين. ومن وجهة نظرنا لا تعد هذه الحالة مؤشراً لتحيز الفقرات فكيف 
ارو geil‏ من سیب ا aaa‏ انمره E‏ كيدا a‏ التعد من الب 
من خلال تحديد البعد الذي تقيسه الفقرات في كلا المجتمعين الفرعيين. فان كانت الفقرات 
أحادية البعد في كل مجموعة, فإن النحنیات المميزة للفقرات المختلفة تكون ناتجة عن قياس 
سردات غامد متفه فان کات المع اتمه الأبعان فى کل مها فان بان التهديات 
السیزه التغرات یکون Lach‏ من تمدنیة الاتسان نذا هانه لا ترجه Sil pel‏ متاسبه کید 
REA PEE‏ ل PENA A Vested‏ ليزه الق انه مخطقه نمی فرع کون 
التفسیر ضبابي (غیر واضع) نوعاً ما. 

ومناك Ua‏ اخری مهمة یجب الترکین علیها تتعلق بکون الفقرات Gated‏ البعد فی کل 
ما a ho‏ مات عير ally aa lage‏ لاه توك كون ارس 
الكائنة San atl‏ تفظف من موه yok‏ لذلك فن كين انیت Gin‏ الفقرات القن 
ey E TE‏ اس یاهاون ce all‏ ایام موه BN‏ توالت ات 
الأصتلية alia)‏ البهد لكل مجموعة فاق ففرا ت لتق فى الاختتار ما ؤالت تقيس سياف 
مختلفة لكلا المجتمعين الفرعيين وبذلك تكون متحيزة.. وفي المجال العملي لا يتوافر لدينا 
ققر ات احادية الف nests‏ لذلك فان كان عد ليل كن ارات ممانی فين EPEE‏ 
ie‏ كان ليذه الفكرات شا تلا ميدن تفه حمق SE‏ هذى من مه لفات 
والادعاء بأن الفقرات التبقية هي فقرات غير متحيزة. ۱ 
تقئيات مريع كاي: 

طور الباحثان شيونمان (Scheueman,1979)‏ وكاميلي (Camilli,1979)‏ تقنيات يمكن اعتبارها 
تقوب لطرائق نظرية الا tS‏ وا الرسيدة ليده pal‏ ات اننا ابلط من 
Bacall Ble‏ على ننارية AeA‏ للققرة. رسد اققو من خلال هده ly CASEI‏ 
أنها غير متحيزة إذا كانت نسبة الأفراد الذين أجابوا إجابة صحيحة على الفقرة هي نفسها 
ضمن فترة الدرجات نفسها في كلا المجتمعين الفرعیین. ويمكن اعتبار هذه الطرائق تقريبات 
لطرائق نظرية السمة الکامنة, ودلك لان days‏ الاشتبار اللاحظة هی تعویض اة الکامنة 
عش قدونن Cea Mera man Sa yee!‏ هده سک تاره مدای شاط 
للسمة الكامنة. 


ويقسم ندریج الدرجة الملاحظة في تقنيات مريع كاي إلى عدة فترأت» إذ نتم المقارنة بين 
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المجتمعات الفرعية في ضوء نسب الإجابة الصحيحة على الفقرة. فإذا تباينت النسب بين 
المجتمعات الفرعية فهذا يعد دليل على تحيز الفقرة. ويبين جدول (3-16) بيانات مثال قسم 
فيه تدريج الدرجات إلى آربع فقرات, تشير فيه الرموز Nij‏ و Naj‏ إلى عدد المفحوصين 
المتقدمين للاختبار في كلا المجموعتين الفرعيتين الأولى والثانية على التوالي في الفترة j‏ لذا 
فإن (25) مفحوص من المجموعة الفرعية الأولى و (315) مفحوص من المجموعة الفرعية 
الثانية لديهم درجات في هذه الفترة. وتشير الرموز Oyj‏ و زو0 إلى عدد المفحوصين في 
المجموعات الفرعية الأولى والثانية وتقع درجاتهم في الفترة (1) وأجابوا على الفقرة إجابة 
سكا وتحفت الكمية ررم باستهداء الال ` 
Tka‏ 
Np Pu‏ 


و زرم هي نسبة المفحوصين في المجموعة 1 والفترة j‏ وأجابوا على الفقرة إجابة صحيحة. 
فمثلاً للمجموعة الفرعية (1) وللفقرة (3) فإن نسبة الإجابة الصحيحة على الفقرة 
ردك = 0.479 وتحسب الكمية زوم بالطريقة نفسها للمجموعة الفرعية (2). وتحسب 
الكمية PJ‏ باستخدام المعادلة: 


رر0+رو0 ی (6-16) 


P‏ = س 
Noy-Niy‏ 


وهي نسبة المفحوصين في الفترة [ جميعهم وأجابوا على الفقرة إجابة صحيحة. وللفقرة 
تفه AW‏ ستاو 
_ 33+14 =299 
5 + 92 
ویحسب إحصائی كاميلي (camilli’s statistic)‏ باستخدام الصيغة: 
Pj) Naj Nij‏ - روط)2 


ی سکس تست 
9 < نا _ (P.y - DP; (Nj‏ 


ویمکن اختبار الدلالة الاحصائية ل 22 بمقارنتها ب 100 (0-1) وتوزیع مربع كاي 
ویدرجات حرية = J‏ وتمثل j‏ هنا عدد الفقرات الكلي. 











وبصورة متبادلة فان مقدار 272 يمكن اعتباره مؤشراً لمدى تحيز الفقرة. ويبين الجدول 
)4-16( حساب 27 باستخدام بيانات الجدول )3-16( ويوجد نسخة من إحصائي كاميلي 
تحمل إشارة ويرمز لها ب 2 (اشارق)» ومع هذا الإحصائي فإن قيم و تعطى إشارة 
موجبة آو سالبة على وفق قيمة prj‏ إذا كانت أكبر أو أصغر من Paj‏ 
جدول (16-3): بيانات توضيحية لحساب 222 و 272 








Scheuneman - Anew method for assessing bias in test items. Journal of educationl مقتبس عن:‎ 
measurement. 16, 143 - 152. copy right 1979 by the National council on measurement in edu- 
cation, washington, D.C. Adapted by permission. 


جدول )16-2( توضيح حساب إحصائي كاميلي Zya‏ 





26.56 = 3.716 + 16.455 + 3998 +2392 = 2. 
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ê 2(P.N2j (روه-‎ XP. - Ny Oy) 
چاو موم وا ی رای‎ rr tT ام ای برچ سین‎ = 5 
۲. Ny بر‎ Py Ny iy 


ويبين جدول )5-16( خطوات حساب ۶ء واقترح شيونمان أن توزيع ول" يشابه توزيع 
0 بدرجات حرية (I) Lasse‏ وأشار العديد من الباحثين بأن هذا ليس صحيحاً إذ يمكن 
اعتبار 2x,‏ مؤشراً لقدار (لدى) تحيز الفقرة, وهناك صيغة ل 27 تحمل إشارة موجبة أو 
سالبة تحسب من خلال إعطاء قيم ز0 -Op3) SPJ N.g-‏ رولار.8) fetis‏ على کون OT‏ أكبر 
آو Jal‏ من PiN‏ 


جدول (5-16): توضيح حساب إحصائي شيونمان و27 








ي 2۳6 = 0.118 + 0.415 + 3.293 + 1.519 + 0.009 + 1.373 + 1.096 
ةي =20C‏ 7.89 











والقضية الحاسمة في استخدام أساليب مربع كاي تكمن في اختيار درجات القطع في 
تكوين الفترات, ويعد هذا قراراً Lage‏ إذ أن اختيار درجات القطع هذه يؤثر على قيمة كل من 
2 و م2 (12050,1982) ويتم اختيار درجات القطع بحيث يكون عدد كافي من المفحوصين 
في کل فترة, وسیتم Yla‏ مناقشة النتائج التجريبية التعلقة بعدد الفحوصین في كل فترة. 
وأشارت شیونمان (1979) إلى أنه ما لم تحدث إجابات خاطئة في کل فترة. فإن هذه الفقرة 
لا يمكن أن تساهم في اكتشاف التحیز, ومع ذلك فلم تخصص أي عدد الإجابات الخاطنة في 
كل فترة, وأشارت إلى أن طريقتها تعتمد بشكل خاص على اختيار فترات خاصة شريطة أن 
يتراوح عدد الاجابات الصحيحة الكلي لكل مجموعة مفحوصين ما بين 10 إلى 20 وذلك في 
كل فترة. ويشير ايرونسون إلى أن هذا المحك يجب أن يحقق تقنية كاميلي أيضاً. BLA)‏ إلى 
ذلك فقد افترضت شيونمان أنه لاستخدام و27 فإن الإجابات الصحيحة المتوقعة للمجموعة )1( 
وفي الفترة (Niy PpO)‏ يجب ان يكون 5 على الأقل لكل ¡ و [. وبطريقة مشابهة اقترح 
ایرونسون أنه لاستخدام 2 يجب أن تكون التكرارات التوقعة لكل من Nij Pj‏ و Nij‏ (م-1) 
بحت أن كون 5 عل Gai‏ ۱ 

وإحدى مشكلات تقنية مريع كاي هو أن الدليل على تحيز الفقرة قد يكون مظهر زائف 
لخطأ القياس. وكما آشرنا سابقاًء ففي تقنيات مربع كاي يتم مقارنة المجتمعات الفرعية في 
ضوء نسبة الاستجابات الصحيحة على كل فقرة, وضمن كل فترة درجة. وإذا لم تكن القارنة 
لكل فترة درجة فإنه يجب مقارنة نسب الإجابات الصحيحة على أنها قياس لصعوية الفقرة, 
alls‏ فإن الفروق في صعوية الفقرة بين المجتمعات الفرعية ليس بالضرورة مؤشراً لتحيز 
الفقرة. فقد يعكس الفروق الحقيقية بين المجتمعات الفرعية على البناء الذي يقيسه الاختبار. 
ویعد ol yal‏ مقارنات من هذا النوع محاولة لضبط مثل هذه الفروق. والمشكلة تكمن فى آن She‏ 
هذه الاداة تضبط في احسن الاحوال الفروق في الدرجة الملاحظة بين الجتمعات الفرعية. ومع 
ذلك فمن الرغوب به ضبط فروق الدرجة الحقيقية (أو مکافشها: الفروق في درجة السمة 
الكامنة) آکثر من فروق الدرجة اللاحظة. وعندما يتم ضبط الدرجات اللاحظة فقد توجد قروق 
في الدرجات الحقيقية بين الجموعات حتی للمفحوصین الذي یقعون في فترة الدرجة نفسها. 
فقس قته النجالة فاح المج E LS EN Sig gills all‏ سیف سل 
الققرة وهذا صحیع حتی للمفحوصین الذين درجاتهم الحقيقية متشابهة gh‏ درخ ة السمة 
الكامنة لهم نفسهاء فان النسبة التي ستجیب بصورة صحيحة على الفقرة ستکون نفسها لكل 
مجموعة. وهنا قد تظهر تقنية مريع كاي موشر لتحیز الفقرة الذي هو صورة زائفة (مصطنم) 
اطا القاس 


== 1 












































ی نت مربع كاي والسمة الكامنة لتحيز الفقرة 

للفقرة لتحيز الفقرة. : وقد أجرى ا ۳ )1979 (ronson & ‘Sabkoviak,‏ تحليلاً 
لخمسة اختيارات فرعية استخدمت في دراسة دولية طولية, وكان الارتباط بين إحصائي 
شيونمان ys‏ و Aj‏ = 0.485 (للبطارية الكلية) و 0.361 (للألفاظ) و 0.652 (للصورة - 
الفسيفسائية). ودون هؤلاء taj‏ الارتباطات دن 2 (بإشارة) 3 Ag‏ (بإشارة) وكانت 
وسيكوفياك أنه من الصعب تفسير هذه الارتباطات لأنه غير معرف بمدی تطابق الییانات 
وكاميلي واقردل )1981 (Shepard, Camilli & Averill,‏ الارتباط بين مقاييس مريع كاي والسمة 
الكامنة لتحیز الفقرة. Slag‏ هولاء البیانات لعینات من السود والشیکانو والبيض على اختبار 
لورج - ثورندايك للذكاء. (اللفظي ویر اللفظي) (الستوی 3 الصيغة B‏ 1954). 

ويبين جدول(6-16) الارتباطات بين مقیاس مریع كاي والسمة الكامنة لتحیز الفقرة. 


حدول (6-16): الارتباطات دين معاملات السمة الکامنة ومربع كاي لتحیر الفقرة. 





T Xs ie 1‏ و و۸ (باشارة). 
ب. الارتباط بين م2 3 Ag‏ 
مقتبس عن: L. Shepard, G. Camilli and MiAverill, comparison of procedures for detecting test‏ 
item bias with both internal and external ability criterion: Journal of Educational Statistics,‏ - 


6,317 - 376. copy right 1980 by the American Educational Research Association, Washington, 
D.c. Adapted by permission. 
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وقد أجرى الباحتان جيتسون ونايت )1980 (Getson & knight,‏ دراسة محاكاة لمجموعتين 
من المفحوصين عددهم )1200( مفحوصاً آجابوا على )5600( فقرة. وحلل هؤلاء البيانات 
بالنموذج ثلاثي المعلم في نظرية السمة الكامنة. 

وأجريت المحاكاة بحيث تقيس الفقرات السمات الكامنة المختلفة لكلا المجتمعين.ويستخدم 
هذا الموقف بالتحديد تحيز الفقرة. ويما أن البيانات من نوع المحاكاة فقد تمكن روندر وزملاؤه 
من حساب القيم الحقيقية ل Ag‏ وحسبوا ارتباطها مع القيم المحسوية لكل من Ag‏ و و2. 

وكانت قيمة LLG YI Jolas‏ الأول(0.80) والآخر (0.73). ويقترح felis‏ على هذه القيم أنه 
عندما تكون الفقرات أحادية البعد لكلا المجتمعين الفرعيين وفی حالة وجود تحيز الفقرة, فان 
م2 يكون دقيقاً كتليل علی مقدار التحیز LS‏ هو الحال Ag J‏ وقد دون Mba‏ معامل ارتباط 
)0.73( بين Ag‏ و Xs‏ 

إن تناول مجموعة معاملات الارتباط من الدراسات الثلاثة يصعب تفسيرها نوعاً. فقد كان 
تحيز الفقرة واضحاً فقط في دراسة روندر وزملاؤه. فقد كان الارتباط بين القيم المحسوية ل 
2x,‏ و Ag‏ الحقيقية كبيراً كما هو الحال للارتباط بين القيم المحسوية والحقيقية ل Ag‏ وهذا 
يقتضي إمكانية استبدالم:2 ب Ag‏ 

وتقترح أن معاملات الارتباط في دراسة ايرونسون وسيكوفياك ودراسة شیبرد تؤشر 
قياس شيء مشترك لقاییس مریم كاي ومقاییس الساحة, ولكن لا يمكن اعتبار مقاییس مريع 
كاي البديل المناسب لمقاييس المساحة. والمشكلة مع الاستنتاج الأخير تكمن في عدم وضوح 
وجود تحيز فقرة فعلياً في الاختبارات التي تمت دراستها من قبل ایرونسون وسبكوفياك 
وشيبرد. لذلك فان ما تقيسه Ag‏ و Ag‏ (بإشارة) غير واضح. لذا فإن غياب قابلية تعویض 
مقاييس المساحة بمقاييس مربع كاي المبين في هذه الدراسات قد يكون Lage‏ أو غير مهماً. 


التقئيات المعتمدة على صعوية الفقرة: 


لقد تم تطوير طرائق عدة لاستخدام صعوبة الفقرة في دراسات تحيز الفقرة. وتستخدم 
هده الطرائق Lol‏ تة الإجانات الصضیحه (ظ) اق Al‏ تخویل ما Agi‏ 


وهذه الطرائق هي تنوع للموضوع والذي يعتمد على واحد من تعريفين لمجموعة الفقرات 
للمجتمع الفرعي الثاني مرتبطة تماما مع صعويات الفقرة للمجتمع الفرعي الأول. فكر في 
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رسم خط بياني لصعويات الفقرة للمجموعة الفرعية tail‏ على الجن العمودي ل وللمجموعة 
الفرعية الأولى على الحو الأفقي x‏ ويتطلب هذا التعريف أن تقع النقاط جميعها على خط 
مستقيم. ويجب ملاحظة أن هذا الشرط ينطبق على صعويات الفقرة المحسوية لكلا المجتمعين 
الفرعيين. ولصعوپات الفقرة المحسوية من GLE‏ كلا المجتمعين الفرعيين يمكن توقع مدى من . 
التشتت حتى عندما تكون مجموعة الفقرات غير متحيزة وفقاً للتعريف الأول. 

وقد تكون الطريقة المشهورة التي تعتمد هذا التعريف تلك التي طورها انغوف وفوردة40901) 
&Ford, 1973)‏ . وتستخدم هذه الطريقة مقياس الفرق لصعوية الفقرة (delta measure)‏ 
ويحدب الفرق للفقرة (g)‏ على النحو الآتي: 

مد ی 4 + 13, Z,‏ هنا هي الدرج» الزائية التي تقطع النسبة (Pp)‏ في الشوزيم 
العياري الطبيعي. وتمثل Dy‏ مقیاس النسبة الصحيحة لصعوبة الفقرة. ولتطبيق الطريقة 
بلس کیب زرلا كي A,‏ لكل فقرة ولکل مجموعة فرعية, ثم الرسم البياني الذکور آعلاه 

فى التعریف. ویبین جدول )7-16( بیانات و تصف اجابات مجتمعات فرعية OLE)‏ 
على عشرین فقرة.وتشير الاحصائیات روط روث ي إلى الجتمع الفرعي الأول. 

al, Pop‏ 2 يك الی الجتمع الفرعي الشاني . وبيين الشكل )2-16( تمثيل بياني ل Ag?‏ مقابل 

Ag‏ ومعامل الارتباط لهذا الخط البياني )=0.96( والذي قد يكون أساسياً. مع ذلك يوجد 
ner‏ فن الخد aay‏ م altel‏ تقاط لفات piece‏ 

إن الطريقة المذكورة أعلاه في اكتشاف تحيز الفقرة تقتضي مطابقة الفقرات على خط 

LSA أي السافة بين الفقرة )2( واتقظ الق وى مظانقه‎ (dy) مين‎ olas asain) 
GS ابر و على انه عون اناس نی اف ومسل هذا‎ tele 
و د۳ إلى‎ (i) هنا إلى تباين الفرق للمجموعة‎ Oy? باستخدام المعادلة )16 -12). وتشير‎ 
= الارتباط بين الفرق للعينيتين. وفي مثالنا كانت 0= 2.68 و و62- 17.926 « و ورط‎ 
Ag, - حيث تمثل‎ 281 . Ag, k= m وكانت تساوي )0.936( والقاطع‎ k وحسبت‎ e 0.961 
=M و‎ 12.063= Ag; 911.851 = Ag كانت‎ WLLL, وفي‎ . Ág و‎ Ag متوسطات‎ Ags 
من الحور الأساسي هي:‎ g النقطة التي تمثل الفقرة‎ sad والقيمة المطلقة للمسافة أو‎ (0.558) 


m + åg». Ag, k 
SRS سس‎ e 


\ 12 + 1 
والفقرات التي لها قيمة dy‏ كبيرة یکون انحرافها كافياً عن الخط لاعتبار الفقرة متحيزة 





ولسوء الحظ لا توجد قاعدة تجريبية (أى بالاستناد إلى نتائج التجرية) لتحديد متى يكون 
انحراف dy‏ كافياً ليؤشر تحيز الفقرة. ويبين الجدول )7-16( قيم dy‏ للفقرات العشرين. ومن 
فحص هذا الجدول يتبين أن dig‏ = -2.170 و dog‏ = -2.31 وهذه القيم أكبر من قيم dg‏ 
للفقرات المتبقية» وهذا يقترح تحيز هذه الفقرات. وعندما تكون قيم عدة ل dg‏ متقاربة (ليست 
أكبر بوضوح) ليصبح تفسير dg‏ أكثر صعوية. 

إحدى الصعوبات التي تواجه طريقة الفرق لصعوية مسي ا 
مجموعة فقرات غين متحین. lady‏ لتعريف السمة الكامنة فان طريقة مقياس الفرق قد تو 
وجود تحیز. فعلی سبیل JBM‏ عند التفكير بالحالة التي تكون السمة الكامنة فیها موزعة 
اعتدالياً في کل مجموعة فرعيةء وكان النحنی المميز للفقرات على وفق نموذج المنحنى 
الطبيعي ثنائي العلم. فقد اظهر هنتر(1975 (Hunter,‏ أنه ما لم يكن معلم التمييز (ag)‏ متساور 
للفقرات كلها فإن مخطط مقياس الفرق سيظهر بعض الدليل على تحيز الفقرة بالإضافة إلى 
أن الفقرات ذات التمييز العالي ستبدو هي الأكثر تحيزاً. وتظهر هذه المشكلة عندما يكون 
توزيع السمة الكامنة ليس نفسه للمجتمعات الفرعية.وفي هذه الحالة يمكن حل المشكلة إذا 
تمت المطابقة بين المجموعات الفرعية فى ضوء السمة الكامنة أو ما يكافئها بدلالة الدرجات 
a‏ وین الوا ان هذا مستمیل. اذا فان الجن النامكن bii Vga Saal‏ من 
الزاوجة والتي هي تقریب للمطابقة على درجات السمة الكامنة. 


حدول (16-7): مقارنة معاملات صعوية الفقرات لمجموعتين: 
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supgroup 
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0.0 


a 


supgroup 1‏ 
شكل )2-16( : مخطط بياني للفرق لمجموعتين فرعيتين 
ويقترح انغوف (Angoff,1982)‏ أن تكون المطابقة على المتغيرات الدخيلة على chai atl‏ 
وترتبط بدرجاته. ويقترح جنسن )1980 (Jensen,‏ استخدام الدرجة الكلية للاختبار» والاحتمال 
الآخر هو استخدام تقدیرات الدرجة الحقيقية. وقدم عمل هنتر وکوهین (Huntr&Cohen,‏ 
)1974 دعم نظري لهذا البدیل. ويجب أن یبقی حاضراً نقطتین مسهمتین عند استخدام 
الأولى: الطابقة بين الفحوصین على وفق التغیرات الدخيلة والدرجات اللاحظهة أو تقدیرات 
الدرجات الحقيقية والتی تبقی مختلفة عن درجات السمة الكامنة. ونتيجة هذا فقد یظهر دلیل 
التطابقة. ویما أنه للمفحوصین التطابقین بدرجات السمة الکامنة تکون الفقرات غير التحيزة 
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متساوية في صعوبتها. لذا فللمجموعات المتطابقة فإن ما يميز التمثيل البياني لمقياس الفرق 
أن لا يكون الاستنباط العالي مؤشراً على عدم التحيز. ويما أنه للمجموعات المتطابقة تكون 
الفقرات غیر التحيزة متساوية في صعوبتها فانه یمکن فحص التحیز باختبار مکنمار J‏ 
(Marscuilo &Mesweeney, 1977)‏ لتساوي نسب الأفراد للمتطلبات الناقشة آعلاه. والفقرات 
التي یکون |حصائي الاختبار الخاص بها Wo‏ إحصائياً تعد متحيزة. وکبدیل (Say‏ أن BAL‏ 
مقدار ركمية) الاختبار ااحصائي علی اله مقیاس coal‏ آو مقدار تحیز الفقرة. 

طريقة آخری لحل مشكلة اختلاف توزیعات درجة السمة الکامنة هو استخدام الجموعات 
الستعارة -(Jensen,1980) pseudogroups‏ وفي هذا التصمیم تجري مزاوجة بين درجة کل 
مفحوص في الجموعة الفرعية الأصغر ودرجة مفحوص في المجموعة الفرعية الأكبر. وبعملية 
الزاوجة هذه تقسم المجموعة الفرعية الكبيرة إلى مجموعتين مستعارتين بحيث يكون توزيع 
درجات إحدى المجموعتين المستعارتين مطابق لتوزيع درجات المجموعة الفرعية الأصغر 
وتتضمن المجموعة المستعارة الأخرى بقية أفراد المجموعة الفرعية الأكبر. وبعدها نجري 
تحليل انغوف مرتین. مرة لکلا المجموعتين المستعارتين ومرة للمجموعتين الفرعيتين. ويعدها 
یمکننا مقارنة منحنی فرق الصعوية لارتباطات المجموعات المستعارة مع النحنى نفسه 
الفجموغات الفرهیة. وتكون الففرة مقميزة فى حالة کون ارتباط الجموعات الفرعية Jil‏ 
بشکل جوهري عن ارتباط الجموعات الستعارة وثانية aay‏ في هذا لتحلیل تحذیرات عدة 
يجب أن تؤخذ بالحسبان. 0 l‏ 

الأول: أنه لا يوجد محك صعب وسريع لمقارنة ارتباطات المجموعتين. والثاني: GY‏ المطابقة 
لا تجري باستخدام الدرجات الحقيقية. فان المطابقة بين المجموعتين المستعارتين من المتوقع أن 
تكون أكبر مما هو للمجتمعات الفرعية حتى عندما تكون الفقرات غير متحيزة بتعريف السمة 
الكامنة. ولسوء الحظ لا يتوافر مؤشر للفرق الذي يمكن توقعه. 

a‏ دای أن Sal‏ موی الق دق A‏ من شمیت یه علن اد 
التعريفين: وتعتمد طريقة انغوف على التعریف الأول. ویتطلب التعریف الثاني لجموعة الفقرات 
غير التحيزة تساوي فرق الصعوبة بين الجموعتین الفرعیتین على الفقرات جمیعها. sling‏ على 
هذا التعریف فان أي فقرة تظهر فرق صعوبة بين الجموعتین الفرعیتین آکبر في فرق الصعوية 
الثالي لجموعة الفقرات فإنها تکون متحيزة. ویجب ملاحظة أن أي فقرة تحقق محك عدم 
التحیز هذا في التعریف الثاني فإنها تحقق محك عدم التحیز في التعریف الأول, ولکن العکس 
لیس صحيحاً بالضرورة. ویستخدم أسلوب تحلیل التباین الستخدم من قبل کل من کاردال 
وکوفمان )1964 (Cardall & Coffman,‏ وكليري وهیلتون )1968 ,111409 (Cleory‏ وبليك وهوقر 
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(Plake & Hoover, 1977)‏ هذ! التعريف. للتعرف على هذه المنهجية انظر: دراسات هؤلاء. وآما 
أسلوب التمديل البياني الذي ا التعريف الثاني وصف من قبل اكترناكت (Echter~‏ 
nacht,1974)‏ وتخضع الطرق التي تعتمد التعريف الثاني للمشكلة نفسها كما هو الحال لتلك 
والتى تعتمد التعريف الأول. وخلاصة القول أن الأدلة على التحيز قد تكون زائفة بالنسبة 
ا القدرة المختلفة المجموعتین» والتصميمات لكل من مجموعات الزاوجة (الطابقة) 
والجموعات الستعارة لها القدرة غلى الحد من هذه UGA‏ ولکن هذه القدرة محددة 
بالعوامل التي تمت مناقشتها. 
مقارنة المؤشرات العتمدة على معاملات السمة الکامنة ومنحنی الفرق 

دوّن العدید من الباحثین الارتباطات بين ول و Ag‏ وكذلك بين الصيغ التي تحمل الاشارة, 
وكان الارتباط بين (الصيغ التي لا تحمل إشارة) عند ایرنسون وسبکوقياك )1979( dy‏ و Ag‏ 
للبطارية الكلية )0.239( وللمفردات )0.373( و للصور - العدد.(265.) ولجموعات الحروف 
(-0.161) وللرياضيات )0.245( وللمقارنات الصورية (الفسيفسائية) (0.088)» بينما كانت 
الارتباطات الناظرة على الصيغة التى تحمل إشارة (491, 0.687. 0.675 ۸0.318 0.419, 
4 ويمقارنة معاملات الارتباط هذه مع العاملات المناظرة لمريع كاي تبين بأن ثمانية 
معاملات أصغر ومعاملان اثنان في حدود التساوي ومعاملان اثنان أكبر. ودونت دراسة 
روندر وزملاؤه معامل ارتباط قيمته )0.61( بين القيم التقديرية ل dy‏ والقيم الحقيقية ل Ag‏ 
ومعامل ارتباط قيمته )0.61( بين القيم التقديرية (dg)‏ والقيم الحقيقية ل Ag‏ ومعامل ارتباط 
قيمته )0.60( بين القيم التقديرية ل dg‏ والقيم المحسوية ل Ag‏ وهذه المعاملات أصغر من 
نظيراتها لمعامل شيونمان Lol CXe)‏ في دراسة شيبرد وزملاثه )1981( فقد كانت الارتياطات 
بين 08 (بإشارة) و Ay‏ (بإشارة) بين البيض والسود )0.52( على الاختبار اللفظي و (0.51) 
على الاختبار غير اللفظيء بينما الارتباطات الناظرة بين البيض والشیکانو فكانت )0.30( على 
الاختبار اللفظي و )0.29( على الاختبار غير اللفظي. وثانية فإن هذه أقل من الارتباط المناظر 
لطرائق مويغ کات هر أن هذه کی اقل قروا لاسفحه ام بل بدا مخ Ag‏ اکن 
مما هو لاستبدال و2 بع 


مزایا الطرائق ASAI‏ ومساوثها: 
یه لمق ف تع sl‏ عنما ان لك يف إن اشرق بين 














خلال تطوير طرائق سمة كامنة متعددة الأبعاد. ويشترك في هذا العيب أيضاً طرائق مريع 
كاي وصعوية الفقرة. وأما العيب AT‏ فهو حجم العينة وعدد الفقرات اللازم لتطبيق طرائق 
السمة الكامنة. وکما أشرنا سابقاً فقد وجد هولين وزملاؤه )1982 (Hulin, etal,‏ حد آدنی 
مقبول من الخطاً عن المعالجة بالنموذج ثلاثي العلم لعينة حجمها )1000( مفحوص ل )30( 
فقرة. ولعينة حجمها (500) مفحوص ل (60) فقرة. وهذه المتطلبات يجب أن تتحقق في كل 
عينة لأن التقدير الدقيق مطلوب في كل عينة. أما النموذجين ثنائي المعلم وأحادي المعلم فإنها 
تتطلب عدد أقل من الفقرات والمفحوصينء فعلى سبيل المثال يوصى بيوريل )1982 (Burril,‏ 
بعينة حجمها 500 مفحوص على الأقل لكل مجموعة. Lais‏ يقترح رايت (Wright gig‏ 
dire &Stone,1979)‏ حجمها 200 مفحو ص لكل مجموعة عند استخدام النموذج أحادي 
المعلم. 

آما المزايا الأساسية التي تشترا ترك بها كل من طريقة صعوية الفقرة ومربع كاي فهي سهولة 
hana‏ ب وأحجام عينة معتدلة نسبياً, إذ تعد العينة ذات حجم 100 أو 200 مفحوص في كل 
مجموعة أو عينة Lals‏ . أما العيب في طريقة صعوية الفقرة فهي أن تحيز الفقرة يمكن أن 
يكون صورة مصطنعة (زائفة) لتباين التوزيع فى الجتمعات الفرعية. وكمبداً فان هذه المشكلة 
يمكن الحد منها من خلال المزاوجة على درجات السمة الكامنة. وهذا المستحيل بعينهء إضافة 
على أن مزاوجة المفحوصين على مبتغيرات أخرى قشل LAS‏ في حل هذه المشكلة. ویمکن 
تصوّر تقنيات مربع كاي على أنها محاولات للمزاوجة على القدرة والمشاركة في مشكلة عدم 
المطابقة التامة مع طرائق صعوية الفقرة. 
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التمارين: 
۱ 1 فيما يأتي صعوبات 10 فقرات لمجموعتين من المفحوصين. باستخدام هذه المعاملات 
i‏ طبق طريقة انغوف وبين الفقرات التي یظهر فیها تحیز. 
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2/ لكل فترة من فترات الدرجات الأريعة للاختبارء يبين الجدول الأتى عدد المفحوصين 
(Noy, Nyy)‏ وعدد المفحوصين الذين أجابوا على الفقرة إجابة صحيحة. (Oz, O43)‏ 
لكلا المجموعتين. استخدم هذه البيانات لإجراء طريقة شيونمان وكاميلي. واستخدم 
القيمة الحرجة الملائمة لتحديد ما إذا وجد مؤّشر الدلالة الإحصائية لتحیز الاختبار. 


والتي صنفت الی أريعة فقرات وفق درجة الاختیار. 





3/ طبق اختبار مولف من 25 فقرة على عينة مولفة من 199 من الذكور و 269 من الإناث. 
Leads‏ يأتي التوزیع التكراري لكل مجموعة من الجنسین. کذلك دون عدد الذین آجابوا 
Ula‏ صحيحة على کل فقرة من الجنسین. استخدم هذه البیانات في |عداد فترة درجة 
مناسبة ومن ثم قم بتطبیق طريقة كاميلي. واستخدم القيمة الحرجة المناسية لتحدید 
وجو تخي و دال detas‏ 


التکرار الكلي وتکرار الاجابات الصحيحة للمفحوصین مصنفة على وفق الدرجة LCM‏ والجنس. 
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الدرجات غير المذكورة لها تكرار = صفر لكلا الجنسين. 

4 تم احتساب معامل الصعوية لراش والخطأ العياري لصعوية الفقرة لعينتين منفصلتين 
من الذكور والإناث.وتم تدريج معالم الفقرة لكلا المجموعتين بتحديد متوسط صعوية 
الفقرات إلى صفر وقيم الصعوبات والأخطاء العيارية مدونة في الجدول الآتي. استخدم 
هذه النتائج لتحديد أي الفقرات متحيزة (إن وجدت). (قد تفترض لتحقيق غرض هذا 
السؤالء أنه يوجد مؤشر كاف لاستنتاج أن الفقرات أحادية البعد لكلا الجنسین). . ٠‏ 


۱ 
i 
i 
i 
أ‎ 
۱ 
۱ 











الوحدة الخامسة . 


ختباروتف 
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به ل an‏ مي ر aame‏ له یسن Sn‏ 





دد tee‏ ای ا ٠‏ ت نزریپ ةا ا ات پیز tee a‏ را مدل معيو وميس .يسيب 








الفصل السايع عشر 
التصحيح للتخمين وطرائق التصحيح الاخری 
قروا T E eek cl te‏ ليرا تشه ارات Sila yada all TE egal‏ 
عن مجموع ole ail Me‏ الفقرات التي تقدم إليهاء af‏ يُعطى الفحوص علامة واحدة لكل إجاية 
صحيحة؛ وصفر لأي إجابة أخرى. ويطلق على هذا sic” Ghat‏ الإجابات الصحيحة". ويمكن 


-a العلامة الكلية للمفحوص‎ xX, حيث‎ 
ER EE Sasa یلام‎ 

وعدن شون الققرات خاب سدم فان ei‏ زوع كرو (alot Gee)‏ ولا تیش اند 
علامات تشجيعية عندما Bing‏ الفحوص الفقرة ا نيترك مکان الاجاية فارعا وتکون اوزان 
ol pial‏ جمیعها slicks‏ وم أن قانون التصحیح هذا بسیط ومباشر إلا آنه يواج مشکلات 
she‏ استخدامه مم فقرات من توم الاختیار من متعدد آو الصح - ALAN‏ 

aa‏ تمق معين Us al‏ اسان cia pally‏ رای فصو sie E R‏ الت زا 
يعرفون الإجابة الصحيحة عليهاء وهذا يسهم في تباين الدرجات اللاحظة. ومثل هذه التباين 
غير مرتيط بتباين الفحوصین على السمة المقيسة. افترض كمثال أن فيليس وجورج تقدما 
glia‏ فیول مواسة مخخصصه, وکان pe So Ge LAAN‏ یه )100 تشر 
ویعرف کل من فیلیس وجورج |جابات 60 فقرة من الاختبار, إلا آن فیلیس ترك الفقرات 
التبقية (وعدد‌ها 40( دون (جابةء في case Glad coe‏ |جابات الفقرات التبقية. وفي حالة 
کون التخمین عشوائياً فقط فان جورج سيجيب على 10 فقرات إجابة صحيحة وبالصدفة فقط 
إذا كان لكل فقرة آربعة بدائل إجابةء وفي حالة تطبیق طريقة التصحيح التعارف علیها فان 
a‏ كيه 70 اخقطة ISI O‏ وهنا يكيم E‏ 
الدرجات اللاحظة لا علاقة له بالفزوق علی Laud‏ اله GSI‏ دالة المیل الی التخمان 


= 65 









































والصدفة العشوائي. وهذا يبرز أهمية استخدام بدائل طريقة التصحيع المتعارف عليها من 
صيغة التصحيح Formula Scoring‏ 

كون الاسلوب التقليدي لتصحیح علامات الاختبار من اق التخمین التفاضلي عبر 
الفصوصین باستخدام صيفة تصحيمح. فقد لاحظ کل من رولي وتراوب Rowley)‏ 
(&Traub,1977‏ إن صيغة التصحيح تعتمد على نمودج يأخذ يعي الاعتيار مواقف محتملة 
ثلاتة: 

- يعرف المفحوص بديل الإجابة الصحيح ويختاره. 

oN peer eae 

- يخمن ويختار عشوائياً أحد بدائل الإجابة التي عددها Jk‏ 

وپالاعتماد على نموذج التخمين العشوائي» فإن صيغة أساسية لتصميح العلامات الخام 
من A‏ التضمین كر علی النجو الاتی: 


ee 2- +R=X,‏ ا 


ج Kt‏ شن dal‏ المتححة flere‏ التخسن: 





0 : هو عدد الفقرات المحذوفة. 


K‏ : عدد البدائل لكل فقرة (وعدد البدائل نفسه لفقرات الاختبار جميعها). ويوضح 
جدول )1-17( حساب الجلامات الصححة من أثر التخمين باستخدام هذه الصيغة 
لثلاثة مفحوصين تتنوع سلوكاتهم التخمينية. ويلاحظ أن التصحیح بهذه الصيغة 
یزید Ladle‏ الفحوص dead‏ وذلك بمکافئته علی الاجابات الحذوفة, Skis‏ على 
افكزاهن sakia‏ أن pall‏ لو اول الأجابة على هذه الفقرات فان Stat‏ 
اختیاره للاجابة الصسمبحة y=‏ وذلك OY‏ یفترض عشوائية التخمین للفقرات 
pierre rent‏ 
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جدول (17-1): حسايات توضيحية باستخدام صيفة التخمين لثلانة مفحوصین تساوت 
غلاماتهم الخام, ولكن باختلاف مد التضمین fe‏ اختبار مولف من 20 فقرغ لكل desi) tye‏ 
بدائل. 





correction)‏ وهي: 
GD Ss R-w/(k-1) = XÎ‏ 
Kb sue‏ : العلامة المصححة من التخمين. 
ssc : w‏ الإجابات الخاطتة. 


suc : k‏ بدائل الفقرة. 

ويبين جدول )1-17( أيضاً تطبیق هذه الصيغة على الفحوصین BIG‏ نفسهم. ومن الوهلة 
الأولى لا بقهن الهیان كاذ تعمل هذه اليه ةتطلى انها تمسميفية والمنطق من مكل هذا 
الاستخدام هو حذف العلامات التي حسبت للمفحوص واكتسبها من التخمين العشوائيء إذ 
إن الافتراخی of pola!‏ کل استجابة BELA‏ عکون Daal‏ عن التغمان العشوائی: duani‏ 
كيف تعمل هذه الصيغة افترض أن لدینا اختبار مؤلف من فقرات لكل منها آربعة بدائل. أي 
أن ۴-1 =3 وبنموذج التخمین العشوائي فان ۷ تمثل 3/4 الفقرات التي لا یعرفها الفحوص 
فتك E a‏ الققرات الت dies‏ إن کون Bilal‏ اشوس 
عنها صحيحة بالتخمین. وتطرح هذه الكمية الأخيرة من درجة الملفحوص عند إجراء التصحيح 

ای PTERA‏ 
ومع أن العادلتین 2-17 و 3-17 تؤديان إلى قیم مختلفة عددياً الا أن ترتیب درجات 


7 سكس 












































المفحوصين هو نفسه في كلا الحالتين. وفي الحقيقة يمكن تبيان أن المعادلة 17-3 عيارة عن 
تحويل خطي للمعادلة 2- -17, لذلك فانه لو طبقت كلا الصيغتين على المجموعة نفسها من 
الإجابات على الفقرات فان الارتباط بينها يكون فسا . ومع ذلك اقترح كل من تراوب 
وهامبلتون )1972 (Traub& Hambeltonm,‏ أن التعليمات المرافقة لكلا الصيغتين قد تظهر 
عوامل سیکولوجية مختلفة لسلوکأت الفحوصین علی الرغم من التکافق الرياضي لهاتین 
الصیختین. 


الأساس المنطقي لصيغة التصحیح Rationale for Formula Scoring‏ 
يتفق مقترحو صيغة التصحيح على أن هذه الطريقة تزيد من ثبات الدرجات وصدقهاء لأن 
الدرجة المصححة تعد تقديراً أفضل لدرجة المفحوص على السمة المقيسة من الدرجة الملاحظة 
غير المصححة. وقد تم تفسير المنطق النظري لهذا الجدال من قبل عدد كبير من السیکومتریین 
إلا أن لورد (lord,1975)‏ قدم تفسيراً واحدً محكماً في محاولته لتوضيح النموذج الذي تتضمنه 

صيغ التصحیح. حدد فيه لورد قيمتين يمتين اثنتين لدرجة المفحوص هما × و Xe‏ 

1/ × هي درجة الفحوص عندما أعطي تعليمات ليجيب على الفقرات جميعهاء واستخدم 
عدد الإجابات الصحيحة في إعطاء الدرجة. 

2 هي درجة المفحوص عندما أعطي تعليمات ليجيب على كل فقرة لديه معرفة جزئية 
كافية تمكنه من حذف بديل أو أكثر من بدائل الاجابة, وحذف الفقرات الأخرى, 
وحسبت الدرجة باستخدام المعادلة 2-17. 

ویستند و ای فى و الفرق بين × و Xo‏ 

للمفحوص نفسه وعلی الفقرات نفسها يُعزى إلى التخمین العشوائي فقط والذي يؤثر على × 
بسبب التخمینات الحظوظة وغير المحظوظة عند إجبار الفحوص الاجابة على الفقرات التي تم 
حثفها حسب تعلیمات dues‏ التصحیم. واشار لورد ایضأاً إلى سار قیم كل من K‏ و Xe‏ 
لأي قيمة 0 :) © عدد الفقرات التي يجب حنفها ضمن شروط صيغة التصحیح). ومع ذلك 
فقد تختلف asd‏ × و Xo‏ لمفحوص معين وفي اختبار ماء وذلك GY‏ تخمينات المفحوص الذكية قد 
تتجاوز Ue‏ أو قد تکون دونها /° قيمة تعدیل الدرجة اللاحظة باستخدام صيفة 
التصحیح). ولأن قیم × تتأثر بالتخمین العضوائي فان تباین × العاین يجب أن یکون آکبر من 
تباين العاينة ل م× ولان تقدیرات کل من × و م× تعد تقدیرات غير متحيزة للمعلم نفسه 
(درجة الفحوص الحقیقیة), فإنه یفضل التقدیر ذى تباين العاينة الأقل, لذا ففي النظرية يعد 
x,‏ تقدیراً افضل لقدرة الفحوص من x‏ ومع ذلك فان الابحاث التجريبية لم تودي إلى دعم 
هذا الاستنتاج. 
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الدراسات التجريبية لصيغة التصحیح: 

في مراجعة للدراسات التي تقارن نتائج التصحیح المتعارف dale‏ وجد دياموند وایقانز 
(Diamond&Evans, 1973)‏ تشابه فى تقديرات الثيات. أو أعلى قليلاً للدرجات غير المصححة. 
الا أن معاملات الصدق كانت أعلى قليلاً للدرجات الصححة. وحتى لورد )1963 (Lord,‏ 
استنتج أن التصحیح من آثر التخمين يؤثر في الصدق ويمكن تمييزه فقط Lesie‏ يكون هنالك 
تبايناً ملحوظاً في سلوكات المفحوصين التخمينية وبدائل إجابة عددها Jil‏ من خمسة 
واختبار صعب. لذا اقترح لورد )1975 (Lord,‏ أن المفحوصين في الدراسات السابقة لم تقد 
إليهم تعليمات حول متى يستخدمون التخمين ومتى يحذفون الفقرة في حالة Gull‏ 
افتراض التخمين العشوائي لنموذج صيغة التصحيح» وقد نادى بإجراء اختبارات تجريبية 
لافتراضات صيغة التصحيح وذلك بتطبيق الاختبار مع تعليمات صيغة تصجيح مناسبة» ومن 
ثم وعلى ورقة إجابة ثانية يطلب من المفحوصين الإجابة عن الفقرات التي حذفوها ولا فإذا 
كانت افتراضات dino‏ التصحيح صميحة فإن الدرجات الناتجة ضمن تعليمات صيغة 
التصحيح يجب أن لا تختلف عن تلك الوجودة على ورقة الإجابة الثانية والمأصححة درجاتها 
من أثر التخمين. وأشارت الدراسات التجريبية المعتمدة على اقتراحات لورد , 1980 (Bliss,‏ 
Cross & Frary, 1977)‏ أنه Losie‏ يجيب المفحوصين على الفقرات جميعها يحصلون على 
درجة ala‏ أعلى مما لو آجابوا بناءاً على تعليمات صيغة التصحیح وصححت الإجابات كما 
اقترح لورد. 

وتقترح النتائج أن سلوكات المفحوصين لا تتطابق مع افتراضات صيغة التصحيح. أحد 
التفسيرات الممكنة؛ هو أن نموذج صيغة التصحيح لا يأخذ بالحسبان المعرفة الجزئية Á)‏ 
طريقة استخدام الفحوص لها خلال العملية الاختبارية)» لذا فان النموذج ضعيف رياضياً في 
تفسيره لسلوكات المفحوصين الواقعية (Gulliksn,1950; Lord 8: Novick,1968)‏ ومع أن 
التحسين الكبير في التقدير الدقيق للدرجة المصححة يجب أن يظهر عند المفحوصين ذوي 
القدرة المتدنية الذين يحذقون فقرات عديدة (0050,1975) إذ أن هؤلاء قد یکونوا هم الأقل فهماً 
وتطبیقاً صحیهاً لتعليمات صيفة التصميم: إلا أن هنالك تفسيراً آخرا ea‏ هوان 
تعلیمات صيغة التصحیح تولد عاملاً آخر في الوقف الاختباري والذي لا یمکن عمل شيء 
تجامه لنطاق الهام التي يقيسها GLORY!‏ ومثل هذه التاثیرات تسمی الأخذ بالجازفة- (Risk‏ 
taking)‏ أو الراهنة الارادية (Willingness To gample)‏ 

وتستخدم دراسات الفروق الفردية في الأخذ بالمجازفة تضمين الاختبار فقرات لا علاقة 
لها بموضوع الاختبار ولا يوجد لها إجابة صحيحة ضمن فقرات الاختبار» وعدد الفقرات هذه 
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التي يحاول المفحوص الإجابة عنها ضمن شروط التصحيح تعد مقياساً dal‏ الفحوص للأخذ 
بالمجازفة ) لوصف odd‏ المنهجية أنظر إلى سلاکتر )1968,1969 (Slakter,‏ وشوو ملخصات 
آبحاث دیاموند وایقانز (Diamond & evans,i973)‏ إلى أن الطلبة الأقل Sue‏ للأخذ بالمجازفة 
یکونون ۰ بتعليمات صيفة التصحيح أكثر من أولئك الذين ميلهم أكبر للأخذ 
ومثل هذه ذه التتائج تیرز استلة حول Sal‏ الدرجات الناتجة عن شروط صيغة التصحیح 
للتفسيرء Lats‏ لذلك فإن الكسب المتحقق في الصدق والثیات والوقت والجهد ee‏ 
والعلاقات الغا tada‏ التي قد تنتج عن ane‏ العقوبة على التخمين والتي تستخد 
ET‏ ونظرية الاستجاية للفقرة: 
Formula scoring and item response theory‏ 
في وصف أكثر حداثة للورد )1980 , (Lord‏ لكيفية JA]‏ صيغة 4 التصحيح بعين الاعتيار في 
تقدير الدرجات الحقيقية في الاختیارات المطورة على وفق نظرية الاستجاية للفقرة (1). . وجب 
أن يسترجع القاري, العمل الخامس عشر أن ی 
لاحظنا ا أن درجه Jaala‏ الحقيقية يمكن تقديرها بجمع alai eae‏ آلاختیار 
اجميعها . وأشار لورد إلى أن هذا التطبيق قد یحتاج إلى تعديل فيما لو كان هنالك تفاضلاً 
بحذف الفقرات من قبل المفحوصين. وقد اقترح خطوات تحديد درجة عدد الإجابات الصحيحة 
للمفحوص (a)‏ بالخطوات الآتية: 
1/ حدد الفقرات التي أجاب عنها الفحوص (a)‏ 
2/ لكل فقرة منهاء > احصل على قيمة (0) ‘Pg‏ احتمالية أن يجيب الفحوصین الذين قدرتهم 
الم )8( على الفقرة bkal‏ صحيحة . 
وهذه العملية يرمز إليها بالصيغة: 


CS E 5 ما )یه‎ 





1 يمكن حذف هذا الجزء دون فقدان الاستمرارية مع الاجزاء التالية من هذا الفصل حیث Ca‏ : الدرجة 
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ya‏ : تعني الجمع للفقرات التي أجاب عنها الفحوص a‏ وتقدير الدرجة الحقيقية يتم 
تصمیحها فیما بعد من آثر التخمین بالصیفا: 


2 
e eee J (0) = 2 YO i 


[1-Pg(8)] = Qg (0) حيث‎ 


&: عدد بدائل الفقرة. 
أساسيين هما: 


1/ تعزى استجابات المفحوصين على الفقرات إلى مستويات القدرة في السمة الكامنة. 
2/ يفهم الفحوصون تعليمات صيغة التصحيح بوضوح ويطبقونهاء آي أنهم يحذفون 
الفقرة إذا (وفقط إذا) لا يوجد لديهم أي شيء أفضل من التخمين العشوائي (/) في 
اختیار الإجابة الصحيحة. 
ولتوضیم استخدام العادلتین )4-17( و (5-17) والشروط التی تعطی نتائج منطقية. دعنا 
نطرح الحالات البینة فى جدول (2-17) التی قد تظهر فى تقدیر الدرجات الحقيقية في نظرية 
الاستجابة للفقرة. l ۱ i ٠‏ 
الحالة الأولى: لدينا أريعة مفحوصين بمستوى القدرة نفسه للسمة الكامنة (0) وأريعة 
فقرات متكافثة فی صعوبتها لكل منها آزودة بدائل» sing‏ هذه القيمة العنية من (Oo)‏ احتمالية 
EES‏ ال ع الف وق he ANU A‏ جنوك WON‏ 
يمكن الحصول عليها للدرجة الحقيقية ويا فيما لولم يحذف المفحوصين الفقرات بالعدل 
نفسه. من الواضح أن قيم Ca‏ تتغير وتكون قيمتها أكبر للمفحوص الذي حذف أقل عدد من 
الفقرات. وهذا غير مرغوب فيه لأننا نعرف أن المفحوصين جميعاً بمستوى القدرة نقسه. ومع 
alld‏ فان eee‏ الدرجات الحقیقية Vag!‏ الفحوصین الاريعة متماقة م انهم اظهروا انماط 
خرف استجانات متحتافة کش 
الحالة الثانیا: لدینا هنا اتتا اريعة مفضحوصین عند مستوی القدرة الکامنة نفسه, 
والفقرات غير متساوية في صعوباتها. فللمفحوصین عند مستوی القدرة هذا تکون احتمالية 
الاجابة الصحيحة على الفقرات (1 , 2, 3, 4) هي )0.25, 0.25, 50 , 0.50( علی التوالي. 
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وتبين الحالة الثانية فى جدول (2-17) قيم Ca‏ و Na‏ لمفحوصين أنماط استجاباتهم المحذوفة 
مختلفة. وثانية نری أن Ca ass‏ متغيرة ویتفضیل الفحوصین الذین حذقوا عدد أقل من 
الفقرات؛ ولكن Na asd‏ للمفحوصين الاريعة متساوية. 

الحالة ARGH‏ وهنا لدينا أربعة مفحوصین بمستوی القدرة تسه وأريعة فقرات مختلفة في 
صعوباتها» يتبين من جدول )2-17( وفي الحالة الثالثة أن قيم Ca‏ أعلى لمن حذف sac‏ اقل من 
والرابع قيم Na‏ منفردة لماذا؟ يتبين أن الافتراضات الأساسية للنموذج انتهكت من قبل هذين 
أقل من )1/4( والمفحوص الرايع حذف الفقرة الثالثة مع إن احتمالية الإجابة الصحيحة عنها 
الإجابة: لذا فان الفقرات لا تقيس سمة مفردة. 
القدرة لكل من:(60, وي (Ne‏ كذلك لا يمكننا معرفة متى تنتهك الافتراضات اللازمة لتقدير 
الطريقة تتطلب تطبيقات تجريبية» ويجب البرهنة على الفوائد العملية المستمدة من تطبیقاتها. 
مكافئة المعرفة الجزئيةعع 150079160 Awarding Credit For Partial‏ 

بما أن الغرض العام لاستخدام صيغة التصحيح هو تجنب إعطاء المفحوصين درجات أو 
نقاط لا ی بستمقونها. فقد ظهرت مشكلة 5 تصحيح أخرى أثارت انتباه ملحوظ وهي مكافئة 
العرفة الجزئية. الأساس النطقي لهنه الطرائق هو أن الفحوصی الذین یحصلون على 
درجات فقرة متمائلة في اختبار من نوع الاختیار من متعدد مصحح بالطريقة التعارف عليهاء 
فقد یختلف هوّلاء في درجات العرفة (العرفة الجزئية) التعلقة بالفقرة. ویمکن تجمیم طرائق 
التصحیح المصممة لنقل العلومات حول العرفة الجزئية بثلاث فئات dale‏ هی: 

Confidence Weighting وزن الثقة‎ - 

Answer- until- Correct gall gies - 


- الوزن التفاضلى للفقرة Option Weighting‏ 
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جدول )2-17( الاحتمالات التوضيحية لإجايات الفقرة الصحيحة 


والدرجات الحقيقية sazi‏ الإحابات الصحيحة وصيغة الدرجات الحقبقية, 





وهدف التقاش العام هنا ليس تبنياً أو دعماً لأحدى الطرائق الوصوفة, ولكن التعريف 
المختصر للقارئ مع تزويده بمراجع توضيحية لهذا الجال والإشارة إلى الصعوبات التي قد 
تظهر عند محاولة تطبیق آحد بدائل التصحیح غیر تلك التعارف علیها. 


وزن الثقه: Confidence Weighting‏ 
تم بناء صيغة التصحیح والتعلیمات بحیث يؤشر الفحوص على درجة نقته (east)‏ من 
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صحة كل استجابة. ومظهر محدد لطرائق وزن الثقة جميعها أن اختيار مفحوصين أثنين 
للاجابة نفسها قد لا يؤدي إلى حصولهم على الدرجة نفسها على الفقرة وذلك لاختلاف درجة 
الثقة باجاباتهم. وقد راجع اكترناكت )1972 (Echternacht,‏ دراسات وزن الثقة واستنتج أن 
مخطط وزن الثقة مع أنه يحتكم إلى أساس منطقي, فإن الزيادة المرغوبة في معاملات الثبات 
والصدق لا تتحقق عموماً باستخدام تقنيات AST‏ تعقيداً سواء في طريقة تطبيق الاختبار أو 
یمه واو cue‏ تلف فو أن وا وی الكقة اليرت cals‏ اتقاش 
قليل في معبامل الصدق sic‏ استخدام هذه الطريقة. ومن الهم ملاحظة إن ثقنية التصحیح 
التي تستنفذ بعضاً من وقت الاختبار ينتج عنها بالفعل زيادة جوهرية في ثبات الاختبار أو 
صدقه. مقارنة باختبار اطول يعطى بوقت اختباري مكافيء للحالة الأولى؛ لذا فان الاهتمام 
بأبحاث تتعلق بهذا التطبيق ابتدا منذ نهاية العقد السابق. 

طريقة أخرى مقترحة لمكافئة المعرفة الجزئية هي الإجابة حتى الصح. أي أن الفحوص 
نكر كرات ek‏ الح les is‏ له tinge Coals teak‏ يمول یا 
انتفاژه للاجابة. فاذا ley! GAT‏ الصحیحاة یعطی تعلیمات بالانثقال إلى الفقرة التالية. وان 
كانت إجابته خاطئة يعطى تعلیمات لاختیار بدیل إجابة آخر للفقرة نفسها. وتستخدم طريقة 
الاختبار هذه ورقة إجابة ذات خیال مخفي أو باختبارات محوسبة إذ تسجل عدد محاولات 
الإجابة لكل فقرة والطريقة التقليدية لتصخيح اختبار الاجابة حتى الصح هو طرح عدد 
الاستجابات المعطاة من الفحوص من العدد الكلى للاستجابات الممكنة & (Gilman‏ 
Ferry,1972)‏ وأشارت اختبارات التحقق من ثبات الدرجات وصدقها المستخلصة من هذه 
الطريقة (Henna,1974&1975)‏ إلى الارتفاع القليل لتقديرات الاتساق الداخلى Lec‏ هو فى 
eal) eas all‏ رنه فلت ولكن وموك قاس تا فى ماوت رر الق ره 
بمحك. وظهر الاهتمام حديشاً بطرائق الاجابة حستی الصع من قبل ویلکوکس 
(Wilcox,1981,1982)‏ الذي طور طريقة تصحیح لنهجية الاجابة حتی الصح تعتمد على نموذج 
الدرجة الحقيقية القوي (Strong true Score Model)‏ واقترحت بعض النماذج للمواقف 
التی تحدد فیها درجة نسبة الاجابة الصحيحة على آنها نسبة الفقرات فى اللف التي يستطيع 
الفحوص الاجابة عنها إجابة صحيحة. إن استخدام مثل هذا النموذج يتطلب افتراضات قوية 
حول توزیم الدرجات الحقيقية آو التوزیم الشرطي للدرجات اللاحظة (Lord & Novick‏ 
)23 1968,00,واحد معوقات استخدام تصحیح الاجابة حتی الصح هو أن آداء بعض 
الفحوصین في الاختبار قد يتأثر تفاضلیاً بعوامل مثل قلق الاختبار أو القدرة على التعلم 
أثناء العملية الاختبارية. واقترح حنا )1975 (Hanna,‏ الحاجة إلى التحقق من هذه القضية. 
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وتستخدم الفئة الثالثة الواسعة من الطرائق الاختيار التفاضلي الموزون (Differential‏ 
Option Weighting)‏ الذي يعتمد على افتراض أن بدائل الإجابة على الفقرة تتبأين في 
ارجا phases‏ وان الت نی يهنا الو لکش ا کون معرهده اكد من 
الفحوص الذي یختار إجابة آقل صحة. ولا تتطلب هذه الطرائق تعلیمات خاصة أو سلوکات 
غير مألوفة في تطبیق الاختبار فضلاً عن إعطاء درجات موزونة مختلفة لبدائل الاجابة تعتمد 
على درجة صحتها. وأحد الطرائق الشائعة للحصول على الدرجات الوزونة للبدائل تستخدم 
تقدیر الخبراء أو الحکمین. فمثلاً استخم باتنياك وتراوب (patniak & Traub)‏ تقدیرات 
الخبراء في ترتیب بدائل فقرات الاختبار جمیعها على أساس صحتها النسبية. ثم استخدموا 
طريقة ثیرستون في القارنات الزوجية لتحدید وزن US‏ بدیل. وقد أعطى کل من ديفيس وفیفر 
&Fifer, 1959)‏ 215)وداوني(1979, (Downey‏ تعلیمات للخبراء في تقدیراتهم البدائل على 
تدریج من (1 إلى 7) تمثل فيه الدرجة )1( إجابة خاطئة كلية و(7) إجابة صحيحة كلية. ثم 
لمكتست و patel sof acl ad‏ وین یقن وس فده طرائق Hascall SIU‏ 
clli_s (Rational weighting methods)‏ وصف کل من حستسمسان 1941 (Guttman,‏ ` 
(طوحوليكسن (Gulliksen,1950)‏ طريقة تجريبية لاشتقاق آوزان البدائل» ويصورة نموذجية 
يستخدم برنامج معین. ولكن المبدأ الأساسي هو أن البدائل التي يختارها الفحوصین ذات 
الدرجات الكلية الأعلى في الاختبار (آو على أي متغير محكي آخر) تحصل على أوزان أعلى 
من تلك الختارة من قبل مفحوصين درجاتهم الكلية أدنى . ونظرياً يرتفع معامل ثبات الفا 
للدرجات الوزونة المختارة بهذه الطريقةء ولكن نتائج الدراسات التجريبية لأوزان البدائل 
مخيبة للآمال عموماً. ومع ذلك هنالك زيادات متوسطة يتم الحصول عليها Ghat‏ في تقديرات 
اتف Coe (aor‏ کات سرد ك أن ab‏ سو ان زمر 
clad‏ مخططا مه تمبحیم RST‏ تففیدا لا ینکن تیا مورا lately‏ ناض كان 
نتائج هندرکسون (Henderickson,1971)‏ وداوني Downey,1979)‏ التي بینت أن آوزان البدائل 
نتم عنها زیادات في معاملات الفا الذي صاحبها اثر جانبي مشكوك فيه لعاملات الصدق 
الرتبط بمحله. لذا ولغاية اليوم فإن الفوائد المتوقعة لاوزان البدائل ليست حقيقية, ومع ذلك 
فمن المکن للتطبیقات الستقبلية لنظرية الاستجابة للفقرة أن نحصل على درجات موزونة 
للإجابات الخاطئة كما هو الحال للاجابات الصحيحة التي أثبتت آنها مثمرة. هذا وقد تم 
وصف دراسة واعدة في هذا الجال من قبل فيسن .(Thissen,1976)‏ وفی مثل هذه الدراسات 
فإن التحسینات في العلومات عن درجة الاختبار أو الدقة في تقدیرات معالم الفقرة والقدرة 
يجب أن تؤخذ بعين الاعتبار کمحك في تقویم كفاءة آنظمة التصحیح الجديدة. 
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التمارين: 





-í‏ أحسب الدرجة ۱ الكلية لكل مقحوص على lal‏ كلك perg‏ التي أجايوا عنها إجاية 


Aaea 


ب- هل يعد المفخوصين ف ه متساویین فى الكفاءة للمحتوی الذي یقیسه الاختیار. 

ج- ما الدرجات التي يحصل عليها المفحوصين فيما لو أجري تصحیح للدرجات من أثر 

د- اثبت أن ترتيب اللفحوصين يكون نفسه فيما لو طبق التصحیم الذي يكافيء العرفة 
O‏ 
E O‏ 

4 باستخدام طريقة جديدة في تطبيق الاختبارات. والتي تتطلب من المفحوصين التلشیر 
الى درجة ail‏ لاستجاباتهم, day‏ الیاحث أن تقدير الثيات للدرجات الوزونة بثقه دثقة 
كانت 0.85 e‏ في حين تقدير ثبات الفقرات نفسها المطبقة بالطريقة التقليدية التعارف 
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عليها كان 0.70 واستغرق الاختبار 90 دقيقة للمجموعة التجريبية فى حين استغرق 


5 افترض أن بيانات الاستجابات المبينة في التمرين الأول جمعت لاختبار طور وفق نظرية 
الاستجابة للفقرة وبالنموذج اللوغاريتمي أحادي المعلم. وكانت درجة السمة الكامنة 
الحسوية للمقحوصين (ج» دء (a‏ نفسها وذلك من خلال دالة النحنی المميز للفقرة: 
وكانت القيم المحسوية ل (01)ي0 لكل فقرة على النحو الآتي: 





آ- ما تقديرات الدرجة الحقيقية للمفحوصين ج د. ه؟ 



































الفصل الثامن عشر 


يتطلب العدید من الواقف تحدید درجة القطع قبل تفسير fail‏ على الاختبار» على سبیل 
الثال: تقسم بعض البرامج التعليمية إلى جزأينء إذ یتقدم الفحوص لاختبار بعد انهاء الجزء 
الأول لیسمح له بعدها بالتقدم إلى الجزء الثاني فقط إذا كانت الدرجة على الاختبار تساوي 
أو تتجاوز درجة القطع الحددة. وفي حالات آخری مثل Jati‏ لبعض التخصصات 
التطبيعية والتسکین يطلب من التقدمین إكمال العرفة التخصصة في الاختبار. ویتم الوافقة 
على التأهيل فقط إذا تساوت درجة التقدم ودرجة القطع آو تجاوزتها . وتطبق الواد درجات 
القطع تعرف عادة على انهاء إعداد العاییر. 

وعلی الدی الواسم یمکن القول Gl‏ هناك BIG‏ اساليب لاعداد العاییر. تتطلب الأولى 
فحص محتوی الاختبار من قبل خبیر آو AST‏ والذي یصدر حکماً بالاعتماد على الانطبام 
الكلي عن محتوی الاختبار. ویعتمد الأسلوب الثاني على الحکم على محتوی الفقرات النفردة. 
ووجهة نظر تقليدية لهذه الأسالیب في اعداد العاییر هو آنها لا تستخدم القضایا 
السيكولوجية التقنية )1978 (Gallagher, 1978 & Linn,‏ والأسلوب الرئيسي الثالث لاعداد 
العاییر يعتمد على أداء الفحصوین, ويعد هذا التوجه سيكومتري نوعاً ما . ومع ذلك فإنه 
يتطلب عنصر مهم من الأحكام العامة إذ أن جميع الأساليب التي تصنف تحت هذا الأسلوب 
ات من معد الفا Lege eal‏ مفحوضی کم اخقیان last‏ وهنه الاتالیب 
البراغماتية الثلاث في إعداد العاییر سیتم وصفها في الأجزاء التالية من هذا الفصل. 

والطريقة ASY‏ شیوعاً لاستخدام درجة القطع الناتجة عن تطبیق أحد أساليب إعداد 
العاییر هو تطبیقها مباشرة علی الدرجات اللاحظة. بمعنی آن aes‏ العاییر لو استنت آن 
درجة القطع الناسبة كانت 0.69 على سبیل JEU‏ بعدها على الفحوص أن يجيب على 9469 
أو اکفو من فقرات الاختبار lel‏ صسحيحة لاجنیاز الاختبار. وطريقة بديلة لاستخدام درجة 
القطع هي تطبیق درجات النطاق. وفي هذا الأسلوب تعالج فقرات الاختبار على آنها عينة من 
مجال اکبر من الفقرات» وکل مقحوص يعد حاصلاً علی درجة النطاق gl)‏ الحقیقة) والتي 
تحدد عادة على آنها نسبة الفقرات من النطاق التي یستطیع الفحوص الاجابة عنها إجابة 
صحيحة. وتستخدم درجة القطع التي یضعها معد العاییر لتجزئة تدریج درجة النطاق إلى 
منطقتین, وهذه تسمی درجة قطع تدريج النطاق. وفي اختبارات التحصيل تسمى هذه الناطق 











حالات السيطرة» فالفحوصین الذين درجاتهم تساوي days‏ القطع أو أعلى منها يطلق عليهم 
أسم مسيطرين حقیقیین. Lely‏ المفحوصين الآخرين فيطلق عليهم أسم غير مسيطرين حقيقيين. 
وحالا pip‏ وضع درجة قطع علی متصل النطاق, فإن الشكلة تکمن في تحدید درجة الق 
اللاحظة التي تسمح لستخدم الاختبار استخلاص الاستنتاجات الاکثر ملائمة لحالات 
السيطرة الحقيقية للمفحوص. ویمکن أن يرافق تحدید درجة القطم اللاحظة الأخذ بعين 
الاعتبار العلاقة بين الدرجات اللاحظة ودرجات النطاق والتي یرافقها tha‏ تصنیف المسيطر 
ا كسان وق الم الشقيق oie‏ انه سیر 

ويطرح هذا الفصل أساليب تحديد درجة القطع الملاحظة والقضايا المتعلقة بها. تحت 
عنوان الاعتبارات التقنية في إعداد المعايير. 

وقبل الرجوع إلى النطاق الرئيسة في هذا E i ht‏ على نقطتين ثانويتين. 
الأولى أننا حددنا النقاش في إعداد درجة قطع واحدة تجزئ متصل الدرجة إلى منطقتين 
اثنتين بهدف الحفاظ على بساطة العرض ومن ناحية أخرى يبدو أن استخدام درجة نجاح 
واحدة هي الحالة الأكثر lead‏ في التطبيقات العملية. ويغض oe‏ عن dale‏ مواقف لاعداد 
alas‏ ا a AN,‏ ا ركاف مظع من احل عم ae‏ ال ا 
عدة مناطق. کمبدا, فان جمیم الأساس المعروضة في هذا الفصل يمكن تعميمها لتناول 
مشكلات تتطلب درجات قطع عديدة. والثانية: هي استخدام درجات القطع في اختبارات 
القبول والتوظيف عندما تستخدم الاختبارات في التنبق عن حالات السيطرة المطلقة على محك 
خارجي. وهذه اموضوعات عرضت في الفصلین الحادي عشر والثاني عشر ولن نتعرض 
الیها مباشرة في هذا الفصل. 
الأسائيب لاعداد العاییر: 

مع آن آدب القیاس وصف آکثر من 30 منهجية لاعداد العاییر في السسنوات الخيرة 
.(Behuniak, Archam bault & Gable, 1982)‏ إلا أنه يمكن تصنيفها ض من واحدة مسن 
فئات GG‏ رئيسة ( ويمكن للقارئ الهتم بمخططات تصنيفية إضافية الرجوع إلى (Glass,‏ 
Hambelton, 1980 , Gaeger, 1979, Meskauskas , 1976 , Millman, 1973).‏ ,1978 وتستخدم 
النهجیات الرئيسة المعتمدة هنا: 

1 أحكام تعتمد على انطباع شامل عن الاختبار أو ملف الفقرات 

2/ آحکام تعتمد على محتوی فقرات الاختبار منفردة. 

3 أحكام تعتمد على أداء الفحوصین في الاختبار. 
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الأحكام المعتمدة على الانطباع الشامل: 

هنا يفحص فريق من الخبراء محتوى الاختبارء واعتماداً على الانطباع الكلي ومجال 
المحتوى تقترح النسبة التي يجب أن تكون Yule LLY‏ صحيحة: وذلك لن سيكون له أدنى 
سنوت هن الا ليكو داق ضمن المستوى المطلوب للأداء وكل محكم pies Bale‏ معيان 
معین» وفي المعيار النهاني يؤّخذ متوسط المعايير جميعها وقد اقترحت شيرد )1976 (Shepard,‏ 
استخدام مجموعة آحکام متعددة تمثل وحدأت متعددة لمن pigs‏ بنتائج الاختبار. فعلى سبيل 
المثال في شهادة الكفاءة الجامعية الأولية يمكن ضم فئات من الطلبة والعلمین وأولیاء الأمور 
وممثلين عن المجتمع المحلي على مدى واسع . 

وتعتمد هذه الأحكام في بعض الأحيان على السماح بخطاء وأشار جلاس )1978 (Glass,‏ 
إلى هذا الاستخدام على أنه العد العكسي الذي بيدأ من %100 » وهو أن معد المعايير 
يفترض مستوى مرغوب of‏ مفصل للأداء على الاختبار يجب أن تكون الإجاية على %100 
منها إجابة صحيحة ولکنها تسمح ببعض الأخطاء > الناتجة عن خطأ القراءة of‏ عدم وضع 
إشارة أى عدم الانتباه أى أخطاء gail‏ وهکذ 

فقد تستخدم بعض المعرفة عن مجتمع المفحوصين من قبل المحكمين. فعلى سبيل المثال 
آورد جلاس في تقریر عق Jib‏ في الصفوف الايتدائية يفيد أنه يمكن تدريب هذا الطفل فقط 
لغاية %70 من الدقة في الجمع لنزلة واحدة. ومن غير الشائع وجود معلمین یقترحون نسبة 
ما iyu‏ %70-60 على آنها معیار معقول لاختبارات من هذه النوعية. وقد یکون اقتراحهم هذا 
بسيب خبرتهم مع مفحوصین عند هذا الستوی. 

ومع أن الأحكام الشاملة هي واحدة من المنهجيات lake PSY‏ في biasa‏ في 
اعد اد العاییر. فانه من الصعب الدفاع عنها عن وجهة نظر منطقية آو سيكومترية ونقد شائع 
لها هو أن مطور الاختبار لا يمكنه معرفة ما إذا كانت عينة خبراء مختلفين لم تؤسس العیار 
عند نقاط مختلفة. sal,‏ الحلول النطقية لهذه المشكلة تظهر الحاجة لاجراء دراسات مكررة . 

les‏ افتراض أن العدد الكلي في الحکام التوافر والناسب ثابت. وفي حالة التکرار مرتین 
فان عدد الخبراء لكل دراسة سینخفض إلى النصف. وپالتالي فان مجموعة المعايير تعد من 
قبل عدد أقل من الخبراء وهذه قد تودي إلى انحرافات من عينة لأخرى . أكثر مما هو 
eee ESE‏ أكير من الخبراء . ومشکلة أخرى أنه لا يوجد تأکید Ob‏ 
الخبراء الختلفین تعتمد على انطباعاتهم على مظاهر الاختبار نفسها أى أن تتشابه إدراكاتهم 
لمجال الحتوی. وهذه قد توّدي إلى انحرافات غير مرغوب بها للمعیار من عينة خبراء GAY‏ 
وعند استخدام هذه المنهجية يجب على مطور الاختبار أن يوفر على الأقل توثيقاً لعدد الخبراء 
ومؤهلاتهم وعملية اختبارهم والتعليمات التي زودوا بها وتوزيع استجاباتهم. 











الأحكام التي تعتمد على محتوى الفقرة: 
تعد هذه المنهجية من منهجيات إعداد المعايير المنهجية التي درسست على ادى الأوسع 
ee‏ ی یو الفكتة سيؤخذ بها « وبالترتیب التاريخي لها . ققد 
قترح نيدليسكي )1954 (Nedelskyo,‏ التقنية الأولى» والتی صسححت على dag‏ الخصوص 
وكانت المعايير التي حددها باستخدام هذه على النحو الآتى: 
ريل کل محکم تملیمات Biles)‏ یکون خبیر abe‏ في مجال آلحثوی) qual‏ اشارة 
لكل فقرة یی عدد الاستجایات التي يمكن للمفحوص الاقل كفاءة (وهي لأقل طالب) ol‏ 
یحنفها. ۱ 
2/ یسجل الحکام ولکل فقرة مقلوپ sac‏ الاستجابات :على سبیل الا لفقرة من خمس 
«Silas‏ فلو استخرح بدیلین فان تسجیل قيمة قيمة القلوب تکون My‏ 


3 إيجاد M‏ وهي مجموعة المقلوب عبر الفقرات جميعهاء ويمكن عدّها الدرجة المحتملة 
للمفحوص الأقل تأهيلاً. كما حددت من قبل المقدرين لذلك الحكم المفرد. 

4/ تؤخذ متوسطات قيم M‏ عبر جميع المتعلمين (UM)‏ . وقد اقترح ندلسكي آما الدرجات 
الناجحة في الاختبار يجب أن تساوي OM HUM‏ حيث k‏ قيمة اصطلاحية تختار 
بشكل مناسبء وتتراوح قيمتها بين 0.5 و .10 وقد تم نقد الاقتراض النطقي الستخدم 
في اختبار K‏ وتعديل قيمة MK‏ » لذلك فإن بعض مستخدمي هذه التقنية يفضلونه 
اليساطة ووضع أقل نقطة نجاح عند (Meskauskas,1976) . UM‏ واقترحت المنهجية 
الثانية من قبل انغوف )1971 (Angoff,‏ ووصفها بالأساس فى ملاحظة تذيلية وذلك فى 
توضيحه لكيفية إجراء تحويلات للتداريج المختلفة بدون بيانات معيارية. وتعطي هنا 
للمحکمین تعلیمات بالأساس لتفکیر فى الجموعة الاقل قبول, وکنلك تقدير نسبة 
الجموعة الاقل قبولاًء وكذلك تقدیر نسبة الجموعة الأقل قبولاً ( ولکل فقرة) والتی 
تستطیع الاجابة على الفقرة (جابة صحيحة (ويمكن التفکیر بهذا على أنه احتمالية 
الاجابة الصحيحة على الفقرة لمن لدیه الحد الأدنى القبول من الكفاءة) aly‏ تجمع هذه 
الاحتمالات عبر الفقرات جمیعها للحصول على آدنی days‏ نجاح وضعت من قبل 
الحکم الفرد . والقيمة التفق علیها لتقدیرات الحکمین جمعیهم تعد أقل درجة نجاح. 
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واقترح أيبل )1971 (Ebel,‏ نظام مشابه لا نخوض ولكنه ميز أن كل محتوى الفقرة الناسب 
ومستوی صعوبتها قد تثر على الحکمین حول الأداء التوقع Gago dell‏ الاقل BLAS‏ على 
الفقرة. وتستخدم هذه التقنية شبكة old‏ بعدین في تصنیف الفقرات (رياعية الخلایا) . 
احد ابعاد الشبكة هو مستوی قبول الفقرة Lol‏ البعد الثانی فهو للصعویة وعادة ما یکون 
ذو ثلاثة مستویات انظر الجدول )1-18( . وفی البداية تصنف الفقرات في خلایا الشبكة, 
ویعدها يؤشر الحکم النسبة المئوية الفقرات في الخلية ویجب أن يجيب علیها الفحوص الأقل 
کفاءة إجابة صحيحة. ویمثل جدول )1-18( نسب مئوية افتراضية في كل خلية والتي يجب 
الحصول عليها من قبل كل محكم. وكذلك يبين عدد الفقرات لكل خلية في الاقواس أسفل 
النسبة الئوية. وتحسب أدنى درجة نجاح موصى بها من قبل محكم واحد بالمعادلة: 
(CELL) Rie eer (M) P 3 = Xc‏ 


جدول )1-18( : جدول توضيحي ونسب الفقرات المصنفة من قبل محكم واحد 
باستخدام منهجية ایبل في إعداد العاییر لاختبار مؤلف من 200 فقرة 














0.20 + (19) 40 + )10(0.50 + (22)0.30 + (35)0.6 +(5)10 + (25)0.50 + (20) 090+ =Xc 
.73.85 =(10)0 + (20)0 + (7)0.25 + (15) 10 + (12) 
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حيث Xe‏ درجة القطع بدلالة الدرجات الخامء و 0 نسبة الفقرات في الخلية التي يجيب 
عنها المفحوصين الأقل كفاءة. 

. هي عدد الفقرات في الخلية‎ Mo 

والمجموع هو المجموع الكلي للخلايا الاثني عشر 

ويمكن الحصول على درجة النجاح النهائية بحساب متوسط قيم XC‏ لجميع المحكمين. 
ويمكن تحويل هذه القيمة إلى تسب الإجابات الصحيحة لدرجة النجاح وذلك بالقسمة البسيطة 
على العدد الكلي للفقرات في الاختبار. 
الأحكام المعتمدة على أداء الفحوصین: 

ينادي العديد من أنصار الاختبارات محكية المرجع بإعداد معايير للاختبار اعتماداً على 
المعرفة البنية على الأداء وذلك أثناء محاولاتهم في تطبيق الاختبارء لذلك لا بد من اختيار 
المحكمين الذين سيشاركون في إعداد المعايير بدقة وذلك لأن لديهم الخبرة لما سيكون عليه 
أداء المفحوصين النموذجي على مثل هذا الاختبار. على سبيل المثال ففي إعداد معايير الاداء 
لاختبار في الجغرافية الجوية في المدرسة الثانوية نفضل استخدام pales‏ المدارس.الثانوية 
كمحكمين بدلا من اساتذة الجامعات فى الطبوغرافيا. لتمييز هذا فقد اشار شيرد (Shepard,‏ 
)1979 إلى آن jules‏ الحکمین هذه تتاثر بشکل ملحوظ بادراکهم لعرفة كيقية اداء الفحوصین 
على الاختبار. ومن الأنسب درجة آکثر استخدام بیانات حقيفية لعينة مفحوصین مختارة 
بشکل مناسب بدلاً من الاستناد إلى محكمين مناسبین معتمدین بدرجة آکبر على انطباع 
خاص درکاتهم حول قدرات الفحوصین في الأداء على اختبار معین. 

وأسلوب مبسط یستخدم البیانات العيارية هو تطبیق الاختبار على مجموعة مفحوصین 
قدرتهم آقل من قدرة الفئة التي یستهدفها الاختبار, ومنها إعداد معاییر لأقل كفاءة استناداً 
إلى وسط آداء الجموعة أو وسیطها على سبيل JON‏ وصف جلاس )1978 (Glass,‏ إعداد 
معاییر آدنی كفاءة لامتحان شهادة الدراسة الثانوية مستنداً على وسید آداء طلبة الصف 
التاسم. ومثال آخر لهذا الأسلوب هو الاختبار العياري الستخدم في غربلة الاطفال ذوي 
صعوپات alll‏ والذي يحدد days‏ قطع لكل مستوی صفي بحیث تصلی بمقدار انحراف 
ای وان ترس gd eR‏ اسف 

واسلوپ آخر یستخدم بیانات مجموعات مفحوصین مختلفین اختلافاً واضماً بمستویات 
الکفاءة على الادة التي سیختبرون بهاء وتحدد درجة القطع بحیث تعظم التمییز بين هاتين 
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(pic pact}‏ وواصف بيرك )1976 (Berk,‏ منهجية تستخدم مجموعات مفحوصين أحداها 
درست المادة التعليمية . والأخرى لم تدرسها ووصف نبدلسكي )1954 (NedIsky,‏ 
الآتى: 

1 اختيار محكمين مؤهلين لديهم مألوفية بمجتمع المفحوصين 

2/ السماح all‏ حکمین بمناقشة - إن آمکن- والوافقة علی مکونات آداء ذوي اقل BLAS‏ 





مطلؤية. 
فی منطقة الوسط. 


6 اعداد معیار الأداء عند نقطة تقاطع منحنی التوزیعین (انظر شکل (1-18)). 


وطرائق آخری لاعداد العاییر لبیانات مجموعتی مقارنة وصفها کلوفر(1980 (Kloffer,‏ 
Bs‏ ولیفنجستون )1977 Livingston,‏ ,ون ۱ 

وطريقة آخری, اقترحت من قبل نيدلسكي تسمى منهجية مجموعة ball‏ الفاصل 
(Borderline group method)‏ وفيها يتم اختيار المحكمين وإعطاء المعلومات كما في الخطة 
)2:1( اعلاه» ولكن یسال المحكمين فيما بعد لتحديد المفحوصين الذين يظهروا في منطقة الخط 
الفاصل في الكفاءة . وتختبر هذه المجموعة بعد ذلك ويستخدم وسيط توزيع درجاتهم في 
تحديد نقطة مستوى أقل كفاءة مطلوية. 

ويشير نقد هذه الأساليب إلى أن المعايير المعدة بناءاً على آداء الفحوصین تتناقض مع 
الهدف الأساسي للاختبارات محكية المرجع لأنه لا يوجد أية إشارة لحتوی الاختبار في علامة 
آو دلالة معايير الأداء. وأوصى جلاس )1978 (Glass,‏ بالاضافة إلى أن استخدام مجموعة 
درست المادة التعليمية والأخرى لم تدرسها. یدق أنه محاولة ضعيفة لتعويض وقت الدارسة 
لاثبات الكفاءة. ونقد مشابه يطبق عندما تتألف المجموعات المحكية من اعضاء ممارسين 
للتخصص أو الوظيفة وطلبة طموحين يبحثون عن Gall‏ في ممارسة الوظيفة آو التخصص. 
وفيما لو أعد معيار يميز بين مثل هاتين المجموعتينء فإن هذا يعد افتراض واضی لصدق 
شهادة الخبرة السابقة والتي تستدعي منطقياً مسألة الحاجة لاختبارات حالية وضعت العاییر 
من آجلها ومع أن هذه الانتقادات تستحق أن AAG‏ بعين الاعتيار عند تأسيس المعايير على 
أساس وحید لأداء الفحوصین ویوجد دعم أكثر لاستخدام بيانات الأداء في عملية إعداد 
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المعايير كجزء من المعلومات المدعمة والتي يمكن استخدامها في مناقشة نتائج معايير الأداء 
التي تم التوصل إليها من خلال منهجيات وطرائق أخرى . 





شكل )1-18( اعداد درجة قطع عند تقاطع منحنیات التوزيع التكراري لمجموعتي المقارنة 

افترض على سبيل المثال أن معيار 90% صح ثم اقتراحه لمستوى الدخول في تخصص 
الصحة « ولكن آشار الاختبار اليداني التمهيدي إلى أن أقل من 15% من الخريجين الحديثين 
في برنامج البكالوريوس لهذا التخصص يمكن أن ينطبق عليهم هذا المعيار. وتوحي هذه 
المعلومات بأن Lundy‏ الممارسة تواجه معضلة جديةء فقد تكون البرامج الأكاديمية الحالية لا 
تعد الاغلبية العظمی من طلبتها السياة العملية الوظيفية. gh‏ آن عملية بناءالاختبار وصدق 
الحتوی النهائي معرض للمساءلة. أو أن العیار الذي آعد كان غير منطقي. وتستحق 
الاحتمالات الثلاثة الذکورة جمیعها أن تؤخذ بعين الاعتبارء وذلك قبل تأسس البرنامج 
الاختباري والتوصية بمعاییر الکفاءة. 

اقترح جایجر )1982 (Jaeger,‏ عملية تجمع ما بين ظواهر الحکم الشامل على آداء 
yet call‏ ك على اترات ل على da‏ الط یم عملية الکه کی الركب 
المتكرر على الفقرةء وتم إنشاء تطبيقاتها في تأسس معايير اختبارات كفاءة المدرسة الثانوية 
في کارولینا. 

وقد استخدمت هذه الطريقة ثلاث مجموعات من المحكمين: معلمو المدارس الثانوية ومدراء 
اكدارمن والمرشدين وخواطدين في الولاية وسكل كل مسك لاكمنال LSAT‏ وريج كل فقرة 
عن او pas‏ = آیحیب على Sipe‏ 

هل نستطیع كل منتظم في الدراسات الجامعية الاولية في شمال کارولینا آن پجیب علی 
هذه الفقرة اجابة صحيحة؟" اعتقد joule‏ أن هذه الکلمات اللطيفة أظهرت الحاجة لتعریف 
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oll‏ مثل ادنی BLES‏ لازمة والسماح للمحکم لیرکن علی الافعال الاکثر قابلية للملاحظة 
الل مان ناما 

ویتم تحدید درجة النجاح الوصی بها من قبل کل محکم بالجمع عبر الفقرات (باعطاء 
Go)‏ و کو لكل إحابة تم ees‏ لكل إا 0 ویحده فوزع شرع alll‏ الوص مها لكل 
لتوزيع درجات النجاح الموصى بها من قبل كل مجموعة كمعيار للمجموعة نفسهاء مع أنه من 
التوقتع آن التجمع الاکبر للمعاییر الوحی يها قد تظهر بالدورات التتابعة. وهذا ما لم یظهر 
بالفعل في دراسة جایجر. ومن الواضع ان الحکمین الختلفین پست خدمون العلوم ات 
الاضافية بطرائق مخظقة Leste‏ یعیدون تقویم الفقرات. 


الأيحاث التجريبية في منهجیات اعداد المعايير: 

من كلذل IGA‏ اة من الط آن E A EE EEEE‏ مدل هل 
تؤدى الطرائق المختلفة فى إعداد المعايير لنتائج ملحوظة مختلفة؟ وهل تعد مجموعات 
الحکمین المختلفين معاییر متشابهة باستخدام التقنية نفسها؟ وما هي العوامل المصاحبة أو 
الرافقة التباین فی اعداد العاییر من قبل محکمین مختلفین؟ لغاية الان. اجریت دراسات 
تجريبية عدة للاجابة عن هذه الأسئلة. ولكن لم نصل إلى الاجابات للحددة. وسنناقش هنا 
يعفن الاقم التو هة للاثيات: 

دعنا Vol‏ نجري مقارنة عبر طرائق أحكام الفقرةء ففي إحدى الدراسات وجد أندروز 
وهيشت؟ )1971 (Andrews & Hecht‏ أن محكمين ثمانية (كمجموعة) استخدموا طريقة Jul‏ 
وأعدوا معايير الكفاءة الأقل المطلوية عند 68% إجابات صحيحة: ولكن معيار 49% إجابات 
صحيحة للمحكمين أنفسهم حصلوا عليها باستخدام طريقة تيدلسكي . 

ولاحظ جلاس )1978 , (Glass‏ من خلال النتائج غير العروفة أن 95% من المفحوصين 
حققوا محك نیدلسکی, ولكن 50% فقط تطابقوا مع محك ايبل. ودراسة AST‏ حداثة لبيونياك 
وزملاؤه )1982 (Behuniak , eta‏ أجروا خلالها مقارنة بین طریقتی أنغوف ونیدلسکی فى 
إعداد معايير اختبار تحصيلي محكي المرجع في القراءة والرياضيات وأسس محكمين عددهم 
ستة لاختبار القراءة متوسط نسبة اجابة صحيحة 56.7% کمعیار بطريقة انقوف و 43.2% 








Lely‏ في اختبار الرياضيات فكانت النتائج عكس wl‏ وإذ كانت النسبة 70.2% بطريقة 
انغوف و 77.1% بطريقة نيدلسكي . ومع أن دراسات المقارنة هذه لا توفر أدلة لأفضلية طريقة 
على غيرفاء الا انها آثبتت بوضوح أن طرائق تحکیم الفقرة الختلفة لا يمكن Lede‏ توائم في 
(عداد العاییر . وکانت النتائج غير متطابقة في الدراسة الأخيرة وذلك لأن مجموعة المحكمين 
قسمت إلى نصفينء وهنالك فروق أساسية بين المعايير الوصی بها من قبل مجموعات 
الحکمین الختلفة باستخدام الطريقة نفسها. 

وقارن کل من کوفلر )1980 (Koffler,‏ ومیلز )1983 , (Mills‏ نتائج إعداد المعايير لطرائق 
الحکم على محتوی الفقرأت والطرائق التي تستخدم بیانات الفحوصین. وعلی وجه 
الخصوص فحص کوفلر إعداد العاییر بطريقة نيدلسكي وأسلوب مجموعات القارنة بینما 
استخدم میلز اسلوب انغوف مجموعات القارنة وتقنیاتمجموعة الخط الفاصل. ومع ذلك فقد 
كانت النتائج مختلطة (ممزوجة) نوعاً ما. فقد آظهرت دراسة میلز أنه عند استخدام ثلاثة 
طرائق او أكثر فمن الممكن الحصول على اتفاق بين طريقتين منهما على الأقل. 

فعلى سبيل المثال كانت معايير طريقة انغوف وطريقة مجموعات القارنة AST‏ تطابقاً مما 
هي مع معايير طريقة مجموعة الخط الفاصل في معظم الحالات المدونة في الدراسات 
ولتوضيح التنوع في المعايير التي قد تنتج في الطرائق المختلفة يبين جدول (12-18) بعض 
نتائج دراسة Glee‏ إذ بدون الاختبازات معينة قائمة معايير النسبة الصحيحة, كذلك يبين 
جدول (2-18ب) نسبة المفحوصين الذين حققوا كل معيار. 

وبينت دراسات آخری تجريبية لإعداد المعايير أن المحكمين بخصائصهم المختلفة قد 
يصلوا إلى توصيات مختلفة تماماً. فعلى سبيل المثال دون جايجر (1886:,1982) فوارق Lage‏ 
فى المعايير الناتجة عن مجموعات مؤلفة من معلمين ومواطنين عندما راجعوا فقرات اختبارات 
كفاءة المدرسة الثانوية شمال كاليفورنيا إضافة إلى أن ساوندرز وزملاؤه (Saunders, etal,‏ 
(1981 وجدوا علاقة بيو مستوی معرفة الحکمین للمحتوی ودرجة النجاح التی حصل علیها 
هر | لكين ریق Rabat‏ ومو مر E teal‏ اجان ولاف اه اعد اف شعا بين فن 
الأنسب الحساب التجريبي لمدى مساهمة کل من الفروق بين الاحسکام وطرائق إعداد 
المعايير النهائية الموصى بها. وقد اكتشف كل من برینان ولوك دور (Brenan & Look-‏ 
wood, 1980)‏ قابلية نظرية إمكانية التعميم للتطبيق في هذا السياق, كذلك فإن هذا الجال 
يحتاج للمزيد من البحث والعمل. 
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جدول )12-18( : أدنى معابير نجاح ( من خلال النسية الصحيحة) المحصلة من 
طرائق مختلفة من deal ys‏ دونها ملز 1983. 





جدول (2-18ب) : نسب الفحصوین الذین فشلو! في النجاح في المعايير الناتجة 
عن طرائق مختلفة. 





أخيراًء فبالاضافة إلى احتمالية الحصول على نتائج مختلفة من قبل عینات محکمین 
مختلفة, وتقنیات مختلفة . فقد آشار فان دير لندن )1982 (Vander Linden,‏ أن عدم توافق 
الأحكام الداخلية قد يكون مشكلة ویظهر هذا عندما يؤشر محکم احتمالية منخفضة لفحوص 
يمتلك أقل كفاءة مقبولة للنجاح في اختبار فقرات سهلة, واحتمالية نجاح الفحوص نفسه في 
اختبار فقراته صعبةء فقد اقترح معامل تناقض یعتمد على نظرية الاستجابة الفقرة وأسس 
تطبیقاتها مع الاحکام التي حصل علیها من طريقتي نيدلسكي وانغوف. وعند GAY‏ بعين 
الاعتبار الحاجة إلى بذل جهود فى هذا Slat!‏ اقترح شيبرد )1980 (Shepard,‏ آبحاث تطبيقية 
اضافية لاعداد العاییر يجب أن تسرغ لبرامج اختبارات التاهیل غير التمیزة. وللتعلم أكثر 











عن أثر التعليمات المختلفة Se‏ ومزای رترب عمل امین ابقل ارف 
eee‏ ی 


اعتبارات عملية في اعداد العاییر: 


بغض النظر عن الطريقة الستخدمة فإنه لا يمكن الاستغناء عن الحاجة إلى آحکام في 
تأسيس معايير الأداء الاختباري. 

ومن المهم تمييز أن إعداد المعايير عبارة عن مشكلة سيكومترية مهمة. فهي ليست قضية 
تقنية فحسب, بل أن توابع ملائمة المعايير آو dose‏ للأفراد والمعاهدة والمجتمع يجب اخذها 
بعين الاعتبار. وللبعض مثل جلاس )1972 (Glass,‏ فان النتائج. النظرية والأسس التجريبية 
للمعرفة التي تخضع لها أساليب إعداد المعايير إن كانت غير ملائمة فإن التطبيق نفسه يبدو 
غير قابل للتعديل ولاخرين (مثل ,1978 Hambelton, Hambelton 1978, 1980 popham,‏ 
(Scriven, 1978, & Shepard, 1976, 1979‏ 

فان الحاجة إلى المعايير موجه لاتخاذ قرارات في سیاقات تربوية وتحليليه؛ وهذا واقع لا 
يمكن الغاؤه او إهماله حتى يتم حل المشكلات الفلسفية والنهجية المتعلقة بالتطبيقات العملية. 
وياعطاء هذه الحالة من المضاهاة وضولاً إلى مشكلة اعداد العاییر» فإن الخطوة الأولى هي 
الاستفسار عما إذا كانت هنالك حاجة ملحة ومنطقية لتأسيس معايير أداء لتفسير درجات 
الاختبار لا زالت قيد المساءلة . فعلى سبيل المثال ففي مجال مثل الدراسات الاجتماعية في 
المدارس الابتدائية فليس من الضروري أن يسيطر الطلبة سيطرة تامة على المادة في وحدة ما 
قبل تدريس وحدة أخرى. ومع أن تقييم تحصيل الطلبة يكون مناسباً إلا أن الحاجة إلى تحديد 
درجات قطع كمؤشر لمستويات السيطرة لمثل هذا الاختبار هو موضوع مطروح للمساعلة . في 
حين أن الحاجة واضحة لمعايير أداء لتفسير درجات اختبار مستخدم في اتخاذ قرار. وينصح 
هنا بمراجعة الأساليب الشائعة لإعداد المعايير وتحديد تلك التي يبدى أنه يمكن الدفاع عنها 
في الموقف المعطى. 

بعد ذلك» فمن المهم تحديد المهددات الشابهة لعدم صدق الاستنتاجات التي أخذت من 
درجات الاختبار. وقد حدد fase (Jaeger, 1979) pasla‏ من مهددأت صدق الاستنتاجات 
المأخوذة فى درجات الاختبار إلى درجات النطاق. وربط الشکلات الختلفة بطريقة معينة في 
إعداد العاییر. وتلك التي تطبق على طرائق التحکیم جمیعها والتي تعتمد على محتوی الفقرة 
تکون متميزةء وذلك لأسباب منها التحدید غير الناسب للنطاق. والخطاً العشوائي المؤثر على 
قرارات en‏ الشطفة: والطزائق غير الناسبة او شير اللائمة GE‏ الفقرات آلتاکن من 
تمثيلها للنطاق وتحيز الأحكام في مراجعة الفقرات منفردة . لاحظ أن المهددات الأولى والثالثة 
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والرابعة ظهرت بالفعل في طرائق بناء الاختبار الخاطئة (أى على الاقل غير ملائمة لتؤكد 
الدرجة اللازمة في صدق المحتوى لأنواع الاستنتاجات المرغوب بها بوساطة درجات الاختبار) 
ومن المحتمل of‏ التهديد الثاني والخامس التي يمكن ضبطها أو خفضهاء أثناء إعداد المعايير, 
بافتراض أن المعايير تأسست لدرجات Gb‏ اختبارها مسيقاً. لذا يبدو أن استخدام عدد كبير 
من المحكسين (ویفضل اككن من 6 إلى 8 الذین استخدموا في دراسات متشورة سابقاً) 
واختیارهم عشوائياً من مجموعة محددة بعناية من المحكمين المؤهلين وتزویدهم بمعلومات 
واضحة عن السیاق التي ستستخدم فيه درجات الاختبار» وتدریبهم على آداء الهمة لتقلیل 
المشكلات الممتملة. وقد زودنا كل من زيكي ولیفنجستون )1977 (Zieky & Livingston,‏ 
وهاملتون )1978 (Hambelton,‏ بإرشادات إضافية ومقترحات تحقق طرائق عدة فى إعداد 
المعايير التي نوقشت هنا. : 
إضافة إلى ذلك » يفصع باستخدام اثنين أو AST‏ من اساليب اعداد العاییر وعینات 
محكمين عديدة تختار عند الضرورة لتمثيل وحدات محكمين مختلفة وملائمة. وفيما لو فشلت 
الطرائق المتنوعة في إنتاج معيار مفرد موصم (كما يجب أن تظهر) فإن السؤال عن تلك التي 
يجب اختيارها أو كيفية المواءمة لتكوين حل مركب مناسب فهذا يتطلب في النهاية حکماً قيمياً. 


وينصح أيضاً فحص الأدلة التجريبية حول LAS‏ اداء الفحوصین النموذجي في الاختبار 
واستخدام هذه المعلومات في تقويم نتائج وضح معايير معينة. افترضعلى سيبل المثال حالة 
تأسس الاداء فيها باحدى طرائق تحكيم الفقرات عن درجة قطع 87% عن اختبار تعلم للاتقان 
فى الرياضيات لأطفال مرحلة الطفولة المتاخرة: ولكن نتائج التجريب الميداني بينث أن نسبة 
بسيطة من الطلبة قد حققوا هذا المحكم بعد التعليم. أن نتائج وضع هذا المعيار يجب أن تؤخذ 
بعين الاعتبار من خلال عدة وجهات نظر. الأولء أنه يجب أن يؤخذ بعين الاعتبار توابع التعلم 
التتابم. فان تقدم الأطفال دون أن يحققوا هذا المعيار فماذا سيكون تأثير هذا على التعلم 
الستقبلي ؟ بالإضافة إلى أن أثر الدافعية من مواجهة إعادة التعليم يجب أن تؤخذ بعين 
الاعتبار. والفرض الضائعة ( من خلال تقليل الوقت لتعليم الموضوعات الأخرى) قد يكون 
عاملاً مشابهاً في مجالات مثل شهادة التخصص, فان نتائج (عواقب) تأهيل المتقدمين الذين 
هم أقل من أدنى كفاءة مطلوبة يجب أن توازن مقابل خسارة المجتمع للخدمات التي يقدمها 
أصحاب الشهادات المؤهلين تأميلاً حقيقياً « والذين فشلوا في تحقيق معيار متشدد. ومن 
الواضح ان كاسن معاییر all‏ دة فطل سوازنة جیدة لتقنية مسلانمة ورؤية واضيهة 
لأهداف وغايات البرنامج الذي يتطلب قرارات عن المفحوصين تعتمد على أدائهم في الاختبار. 
إحدى الأساليب تسمح لعد المعايير أن يأخذ هذه التوابع بانتظام تتطلب تطبيق نظرية القرار. 
والتي ستناقش في الأجزاء AS‏ 
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اعتبارات تقنية في إعداد المعايير: 


يركز الأدب التقني في إعداد المعايير على إحدى القضايا الأساسية. هي إعداد درجة قطع 
على التدريج الملاحظ تسمح لمستخدم الاختبار تكوين خلاصات عن حالة السيطرة الحقيقية 
المفحوصی والتي تم تحدیدها علی Gunde‏ درجات التطاق. وکما سنری. فان العنی اللات 
الخلاصات المناسبة یعتمد على الطريقة المستخدمة في إعداد درجة القطع على التدریج 
اللاحظ . وفي بعض الطرائق تحدد اللائمة من خلال احتمالية التصنيف الخاطئ. وستصف 
في هذا الجزء أساليب عدة لهذه المشكلةء وکل أسلوب موصوف هنا هو تطبیق لنظرية القرار 
والتي تم عرضها في الفصل الثاني عشر. كذلك فإن الأدب التقني طرح قضية تقنية آخری 
PRENN‏ ماء ویعتمد تطویر معامل لتکمیم نوعية القرارات المأخوذة على درجة القطم على 
التدريج الملاحظ. والأبحاث التي تعالج هذه المشكلة تجدها في )1977 (Wil- (Mellen berg,‏ 
cox, 1977)‏ و )1980 (Hunyh,‏ يمكن للقارئ الهتم بالوضوع الرجوع إليها. 


إعداد درجة قطع على التدريج اللاحظ: 

تقليل احتمالية التصنيف الخاطئ: تقسم درجة قطع تدريج النطاق درجة النطاق إلى 
منطقتين: مفحوصين عند days‏ القطع آو أعلى منها وهؤلاء مسيطرين حقيقيين» ومفحوصين 
درجاتهم آدنی من درجة القطع وهؤلاء غير مسيطرين حقيقيين وتفسر درجة النطاق 
للمفحوص على أنها نسبة الفقرات من النطاق التي يستطيع المفحوص أن يجيب عنها إجابة 
صحيحةء كذلك فإن مدى تدريج درجة النطاق يمتد من صفر إلى 1. 

وسنرمز إلى درجات النطاق بالرمز E‏ ودرجة القطع على تدريج النطاق وكما لاحظنا من 
البداية أن ما فد تستخدم في أي من طرائق إعداد المعايير الموصوفة في الاجزاء السابقة. 
ويما أن تدريج درجة النطاق هو تدريج لدرجات النسبة الصحيحة وطرائق إعداد المعايير ينتج 
عنها درجات إما على شكل نسبة pte‏ أو تدريج عدد الإجابات الصحيحة فمن الضروري 
تحويل درجات القطع هذه قبل تفسيرها على أنها fo‏ . وفيما لو تم التعبير عن درجة القطع 
على متصل النسبة الصحيحة فإنه يجب تقسيمها على 100 للحصول على 10 : وفيما لو تم 
التعبير (gic‏ على تدريج العدد الصحيح فيجب تقسيمها على عدد الفقرات المستخدمة فى 
إعداد درجة القطع من أجل الحصول على م]. 

وحالما تتحدد to‏ فإن المشكلة تكمن في تحديد درجة القطع على تدريج الدرجات الملاحظة 
والتي تسمح لمستخدم الاختبار عمل استنتاجات مناسبة حول حالات السيطرة للمفحوصين. 
وعادة يرمز لدرجة القطع الجديدة بالرمز Xo‏ . ويعبر عنها على تدريج العدد الصحيح والذي 
يرمز له بالرمز ×. Ulag‏ تختار قيمة XO‏ فان كل مفحوص يكون في إحدى الفئات الاتية: 
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1( صح إيجابي: حصل على درجة نطاق تساوي أو أكبر من Gaps bo‏ الملاحظة تساوي 
0 أو آکیر منها 3 
2( صح سلبي : حصل على درجة نطاق أقل من من to‏ ودرجة ملاحظة آقل من XO‏ 
XO‏ ش 
20 
إحدى طرائق حل هذه ULM‏ یتضمن اختبار قيمة 160 التي تفل احتمالية التصنیف 
والتغاب ا هذه المشكلة نستخدم تقدیرات هذه الاحتمالات» ویتطلب : تقدیر هذه الاحتمالات 
عمل افتراضات تتعلق بالتوزيع ثنائي التغير لدرجات النطاق والدرجات الملاحظة. 
والافتراض النمونجي لتوزیع ثنائي التغیر لکل من درجات القطاق والدرجات اللاحظة هو 
التوزيع من نو È‏ بيتا 7 ثنائي (B- binomial dist)‏ وا تم هونیه (Hunyh,‏ هذا 
التصنيف الخاطي» ا ان ا كان عق فتاه کر 
الصفر أو الواحد فانه يمكن تقریب clo XO‏ النحو الاني: 


)2-18( + مرول‎ _1-(KR21I) ب‎ KR/21..n = Xo 
K R (21) K ROD) 


حيث تمثل 2 عدد فقرات الاختبار. وتظهر دقة هذا التقريب إذا تألف الاختبار من 20 فقرة 
أو أكثرء وكانت to‏ فى المدى بين 0.50 إلى 0.80. .(Hunyh, & Saunders,1980)‏ ويبين جدول 
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المجموعات الستة 28-31 , to‏ = 0.75 ومع ذلك فإنها تختلف في KR21‏ و / آو [im‏ 
ويتفحص السطر الأفقى =KR21‏ 0.6 أو =KR21‏ 0.8 نرى إن XO‏ تعتمد على متوسط درجة 
الجموعة. ویازدیاد Ue‏ فإن Xp‏ تقل. ولاخذ هذه النتائج وفقاً لعلاقاتها الصصيحة: افترض 
أن to‏ كانت 0.75 و N‏ = 0.28 وبالحدس. علينا أن نتوقع أن Xp‏ تكون =n‏ 21ء gay‏ آننا 
نتوقع آن درجة القطع على التدريج الملاحظ تتطلب من الفحوص أن يجيب على 7590 من 
ae‏ إجابة صحيحة لنقرر أنه مسیطر. ویتمحیص آي من السطور نرى أن XO‏ تساوي 21 
يبأ عند =[x‏ =0.21 ومع ذلك فإن XO‏ تتجاوز 21 عندما تكون flx‏ أقل من DL‏ وتكون 
اقل من 1 عندما تكون [x‏ آکبر من 21. لذا فان الفحوصین من مجموعة متوسطها أكبر من 
م تکون Lays‏ القطع لهژلاء على متصل الدرجة اللاحظة آقل تشدداً من درجة القطع 
chancel‏ من مجموعة لها متوسط اقل من و 
ay,‏ على الآقل يرين سسنيج slaty‏ و على فلا الهدهاء عنما تكو درجات 
معظم المفحوصين أعلى من 7.0 فان معظم هؤلاء يكونوا مسيطرين وطريقة وضع 0× التي 
تعكس هذا الاعتقاد هو وضع درجة قطع ملاحظة أقل. والتفسير الثاني مرتبط بتقديرات 
الانحدار للدرجات الحقيقية تذكران معادلة تقدير الدرجة الحقيقية هي: 


A 


(Ux-X) BEST 


وكما cad‏ هذه المعادلةء فإنه يتوقع أن تكون الدرجات الحقيقية للمفحصوين الذين درجاتهم 
الملاحظة اقل من التوسط أعلى من درجاتهم Aba UY‏ أما الملفحوصين الذين درجاتهم 
اللاحظة أعلى من التوسط فيتوقع أن تكون درجاتهم الحقيقية أقل من درجاتهم الملاحظة. 
ماذا يمكن أن يحدث إذا كان لدينا مفحوصين أثنين لهم clay 21= Um‏ أحدهم من مجموعة 
لها UM‏ -17, والأخر من مجموعة لها UM‏ = 0.25 إذا كانت 1821 تساوي 0.6 فإن 
الدرجة الحقيقية الحسوية للمفحوص الأول = 19.4 وللآخر= 22.6 ( أو 21) لذا فان كانت 
mg‏ تستخدم على آنها درجة القطع على التدریج اللاحظ فان الفصسوص الأول سیتم 
تصنیفه. على أنه غير مسیطر والآخر مسیطر. وبدلاً من استخدام الدرجات الحقيقية القدرة 
فان طريقة هونية تعدل Xo‏ لتعکس العلاقة بين الدرجات اللاحظة ودرجات النطاق. 
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جدول (3-18) : آثر التغیر في KR2‏ و Ux‏ علی160 





م = 28 ؛ وا = 0.75 لکلا الجموعتین 


ويبين جدول )3-18( أنه بازدياد 161821 فان تباين Xo‏ دالة لنقصان Ux‏ . إلا أنه كلما 
Oe hs 5-6‏ ان Xo‏ تقترب من ay 0.5 + m9‏ عن ta‏ با نان خط 
E asi‏ استخدام طراتق مثل طريقة eign‏ فيالبرامجالاختبارية: التی 
تطبیقات اختبارية یفصل بين کل تطبیقین سنة. ویتألف الاختبار من )100( فقرة و مات 0.70 
> وفی السنة الأولى كانت 15821 = 0.75 و =x‏ 0.7 لذا فإن درجة القطع Xo‏ تقرب على 


69.46 = 0.5 + )71( ۳.75 _ + (0.70) _ 0.75 - 100 
75 0.75 


أو 69 لأقرب عدد صميح. افترض أنه في السنة الثانية كانت 216021 075 ثابتة 
ولكن fix‏ = 0.74 لذا فان التقريب الجديد لدرجة القطع 0× = 68 لأقرب عدد صحيح. 
والسؤال الذي يواجه مستخدم الاختبار في السنة الثانية يتعلق بأي من درجات القطع 
سیستخدم؛ هل 69 من السنة الاولی ام 68 من السنة الثانية. لاحظ ان متوسط الدرجات في 
السنتین كان متضابهاء وهذا دکیل علی آن US‏ العینتین Shad‏ الجتمم نفسه. لذا فان التوزیع 
ثنائي الحد لدرجات النطاق اللاحظة هي نفسها في كلا السنتین. وهکذا فإن (۰69 68( تعد 
تقذیرات لدرچة القن تفسها: ویتمسم ad tae‏ الاخقباز اة امهل دزجة القع 69 
وذلك للحفاظ على الاتساق من سنة لأخرى. والان انترض أنه كانت قيمة 161821 في السنة 
الثالثة 0.75 ولکن »ال = 81 والتقدیر الجدیر لدرجة القطع یکون 66 ALG,‏ نطرح السژال 
نفسه. آي من درجات القطع نستخدم» إذ أن متوسط درجات السنة الثالثة یختلف كثيراً عن 
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متوسط درجات السنتان السابقتین. وهذا مؤش إلى أن Tse‏ السنة THEN‏ وعیتات السنتین 
الاولی والثانية هي عینات لجتمعات مختلفة. وبما أن درجة قطع الدرجات الملاحظة يعتمد على 
مجتمم الفحوصین فان درجة القطع الجديدة )66( ودرجات القطع القديمة )68 و 69( من 
الحتمل آنها تقدیر لدرجات قطع مختلفة, لذا لتقلیل احتمالية التصنیف الخاطئ لفحوصي 
السنة الثالثة فانه من الأنسب الستخدم 0× = 0.66 ولکن استخدام درجة القطع المحسوية 
هذه تسبب بالتاکید مشکلات قانونية (أخلاقیة)» إذن فان مفحوصي السنة الثالثة بمتوسط 66 
سینجحون, ولکن مفحوصي السنتین الأولى والثانية الذين حصلوا على 66 سیفشلون في 
الاختبار» وهنا یظهر تناقض بين المبادئ السیکومترية والأخلاقية. 

وهنالك أسلوب لاعداد درجة قطع للتدریج اللاحظ ويلغي هذه الشكلة, وفضلاً عن إعداد 
to‏ فمن الضروري إعداد کل من : ۱ 

ti‏ : وهي أعلى درجة نطاق تقع تحديداً في منطقة عدم السيطرة. 

2 : وهي أدنى درجة نطاق تقع تحديدا في منطقة السيطرة. 

ويطلق على المنطقة الواقعة بين tr‏ و 2] نطاق عدم الاختلاف (Ind: fferene zone)‏ « 
ونحن غير متأکدین من أن الفحوص الذي تقع درجته في هذا المدى مسيطرأ » وكنتيجة لا 
نهتم باحتمالية التصنيف الخاطئ للمفحوص الذي تقع درجته في هذا المدى؛ aig WSL,‏ 
باحتمالية التصنيف الخاطئ للمفحوص الذي درجة نطاقه ty‏ على أنه مسيطرء وكذلك 
باحتمالية التصنيف الخاطی للمفحوص الذي درجة نطاقه را على أنه غير مسيطر. ونتيجة 
لذلك فإننا نحدد 20 بحيث تكون أكير هذه الاحتمالات أصغر ما يمكن. وتسمى هذه الطريقة 
تصغير القيمة الکیری (Hunyh, 1980b) (mininax, procedure)‏ وذلك لأنها تقل آکبر 
احتمالية للتصنيف الخاطئ. ومن جهة آخری فإن XO‏ الحددة بهذه الطريقة لا تتغير بتغير 
مجتمع المفحوصين (وهناك طرائق أخرى لطريقة تصغير القيمة الكبرى تتغير فيها قيمة Xo‏ 
بتغير مجتمع المفحوصين). 

Ske,‏ هذه الط هکس مالیا كل عن ا 
واحتمالية التصنيف الخاطئ لمفحوص درجة نطاقه 2] ولكل درجة قطع محتملة. ويبين جدول 
)4-18( هذه الاحتمالات t‏ = 07 , 1= 0.85 ولاختبار مؤلف من 7 فقرات. Ulag‏ تحسب 
هذه الاحتمالات فإنه يتم تحديد أقصى احتمالية عند كل درجة ghd‏ ويؤشر لكل قيمة منها 
بنجمة (*) » ويتم اختيار الدرجة المرتبطة باقل احتمالية قصوى من هذه على آنها XO‏ 
ويتفحص هذه الاحتمالات المشار إليها بالنجمة فإنذا نختار 6=×0. وعند درجة القطع هذه فان 
أكبر احتمالية للتضصنيق الخاطئ تكون لفحوص درجة نطاقه 1= 0.3295 وعلى الرغم من 
أن 0× هي درجة القطع لأصغر قيمة كبرى إلا أن المفحوصين الآخرين يكون احتمالية 
التصنيف الخاطئ لهم أقل من 0.3295. 
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ولحساپ احتمالات التصنیف الخاطی من الضروري تأسیس افتراض یتعلق بتوزیع 
الدرجات الملاحظة الفحوصین درجة نطاقهم 11 ولفحوصين درجة ة نطاقهم t2‏ واحد من 
الافتراضات الشائعة أن توزیع کل منهما هو توزيع ثنائي الحد (عرض في الفصل السادس). 
ویمکن التوزیع ثنائي الحد کمتال في حساب احتمال عدد مرات ظهور الرأس M‏ 
عند رمي قطعة نقد لرات عددها r‏ ویمکن استخدام هذه الطريقة حتی إذا كانت احتمالية 
ظهور الرأس ليست 0.5 . والمنطق في استخدام التوزيع ثنائي الحد في إعداد المعايير هو أن 
درجة النطاق عبار عن سه الفقرات من النطاق التي بستطیم Way saga lll‏ عنها إجابة 
صحيحة: لذا فان درجة التطاق (Sag‏ تفسیها gle‏ انها ها Ulla)‏ الفحوض إجابة 
صحيحة عن فقرة اختیرت عشوائياً من النطاق. 
ويستخدم التوزیع ثنائي الحد ف حساب احتمالية إجابة مفحوص days‏ نطاقه = t‏ إجابة 
صحيحة على فقرأت Lasse‏ 6 اختیرت عشوائباً من فقرات كلية Lasse‏ ۸. 
جدول )4-18( احتمالات التصنیف الخاطی لدرجات نطاق 0.70 و 0.85 لدرجات 
القطع الملاحظة امحتملة جمیعها 





ويبين الجدول )5-18( احتمالية کل درجة ممکنة لاختبار افتراضی مؤلف من 7. فقرات 
لفحوصين درجات نطاقهم t‏ = 0.70 و ما = 0.85 والتي حسيت باستخدام التوزيع ثناني 
الحد . وتعتمد الاحتمالات في جدول )4-18( على الاحتمالات المبينة في جسدول a‏ 
ولتبیان کیف تم الحصول على النتائج في جدول (4-18) من بیانات جدول )5-18( افتر 
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أن XO‏ وضعت عند0 » والمفحوص الذي days‏ نطاقه 0.7 (غير مسيطر) سيكون تصنيقه 
خاطئ فيما لو حصل على درجة 0 أو أعلى في الاختبار. وعلى وفق جدول (5-18) فإن 
احتمالية حصول المفحوص الذي درجة نطاقه 0.7 على درجة 0 أو أعلى تساوي (0.3177+ 
1 + 0.824= 0.6472( وهذه احتمالية خطأ (الخطاً الموجب) لفحوص درجة نطاقه 0.7 
عند Lous‏ قطع 0 لفحوص Lays‏ نطاقه 0.85 (سسیض) یکون تصنیفه خاطیع اذا حصل 
الفحوص على درجة اختبار 4 أو آقل. وثانية وفق جدول )5-18( فان هذه الاحتمالية تساوي 
)0.0167 - 00109 + 0.0012 + 0.001 + 0.00 = 0.737( ویمکن تحدید احتمالات 
التصنیف الخاطی لدرجات القطم الأخری بطريقة مشابهة. 

ies فان اقم‎ alias 7 الوا من‎ adil ail آنه لككتبازنا‎ Sc 
الخاطی للمفحوص تساوي )0.3295( افترض أن مستخدم الاختبار يأمل استخدام هذا‎ 
الاختبارء ووجد أن هذه الاحتمالية عالية بشکل مفرط. وإن كان عملیاً زيادة طول الاختبار فانه‎ 
یمکن تقلیل هذه الاحتمالية. وتقترح هذه الحقيقة طريقة لتحدید طول الاختبار و 0× . أولاً:‎ 
(4-18) جدول مشابه لجدول‎ sel قرر وعلی ضوء آقصی احتمالية للتصنيف الخاطی, ثم‎ 
هذه لا تعطی اقصی‎ XO وان كانت‎ KO Lead للاختبار بطوله الاصلی واختر بشکل موقت‎ 
tas وهف‎ Sad الحتمالية والقى تکون اقل من اخفتال ال الف يدها أخنف إلى الاخقای‎ 
الجديدة, واحتمالات التصنیف الخاطی. استمر بهذه الطريقة حتی تصل إلى طول اختبار‎ 0 
هذه‎ (Wilcox, 1976) وویلکسوکس‎ (Fahner, 1974) من فاهز‎ JS وقد ناقش‎ Xo مناسب وكذلك‎ 
AST الطرائق بتفاصیل‎ 


جدول )5-18( : توزیعات الاحتمالية لاختبار مؤلف من 7 فقرات لدرجات النطاق 0.70 , 0.85 
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تقليل الكلفة المتوقعة للتصنيف الخاطئ: 

سيتم وصف أسلويين يهتمان بتقليل احتمالية التصنيف الخاطئ. ويكون هذا الأسلوب 
ایا عندما تكون الأخطاء : الخطأ الإيجابي. والخطأ السلبي متساوية في جديتها. وفي 
العدید من الواقف لا یکون هذا صحيحاً. فعلی سبیل الثال ففي النهج النظم هرمياً يكون 
ihai - Usd‏ السلبي. وعندما يتم عمل خطأ من نوع الخطأ - الايجابي فان التلمیذ سینتقل 
إلى الوحدة التالية قبل أن يكون جاهزاً للانتقال, وفي حالة خطأ من نوع الخطأ - السلبي فإن 
التلميذ سيبقى في الوحدة نفسها. ومع أن استمرار التلميذ في الوحدة نفسها سيؤدي فقط 
إلى مراجعة قصيرة نسبياً للوحدة, وبالتالي لا يكون الخطأ جدياً بدرجة كبيرة. 

وتستخدم الطرائق التي تأخذ خسارة التصنيف الخاطئ بالحسبان مفهوم الخسارة 
المتوقعة. وسنوضح هذا المفهوم وهذا النوع من الطرائق بتطبيق طريقة تصغير القيمة الکبری 
لاختبار الفقرات السبع الافتراضي الستخدم في الجزء السابق. وبدلاً من تحديد درجة القطع 
التي تقلل أكبر احتمالية للتصنيف الخاطئ. فإن طريقة تصغير القيمة الكبرى الجديدة ستقلل 
أكبر خسارة ناجمة عن التصنیف الخاطی. 

افترض أن خسارة الخطأ الإيجابي 5 وخسارة الخطأ السلبي 0.5 (ولغاية الآن سنتجاهل 
قضية كيف تم الحصول على هذه القيم). دعنا نأخذ بعين الاعتبار توابع اختيار4-760 وتع 
درجة القطع هذه فإن الفحوص ذو درجة نطاق وا = 0.70 تكون احتمالية تصنيفه خطأ Und)‏ 
إيجابي) تساوي 0.8741 (أنظر جدول 4-18). والخسارة التوقعة تساوي خسارة التصنيف 
الخاطئ مضروياً باحتمالية التصنيف الخاطئ أو 5 x‏ 0.8749 = 4.3705 والخسارة 
التوقعة للتصنيف الخاطئ لمفحوص days‏ نطاقه را= .85 تساوي 0.5 x‏ 0.210 = .6.0 
وإجراء هذه الحسابات لدرجات القطع المحتملة جميعها تؤدي إلى النتائج المبينة في جدول 
(6-18). ودرجة القطع التي تؤدي إلى الأقل من قيم تصغير القيمة الكبرى عند 0×= 7 ويأخذ 
الخسارات المتوقعة بالهسبان» فإن درجة القطع آکبر من تلك التي تم الحصول عليها 
بتخفيض الاحتمالية الأكبر للتصنيف الخاطئ. وهذه تظهر GY‏ خساراتنا تشير إلى أن tha‏ 
thal‏ - الإيجابي يكون جدياً عشرة أضنعاف ما هو للخطأ السلبي. وبالتالي فإننا نحتاج إلى 
درجة عالية قبل أن نستنتج أن. الفحوص مفحوص مسيطر. 














جدول (6-18): الخسارات المتوقعة لدرجات نطاق 0.7 و 0.85 لدرجات القطع 
الملاحظة الحتملة جمیعها. 





* تشیر إلى أقصى خسارة متوقعة لكل درجة قطع محتملة 

وتقلل طريقة تصغير القيمة الکبری أكبر خسارة متوقعة» وهذه تمکننا من تطویر طريقة 
تقلل الخسارة التوقعة الكلية. وقد استخدم هونیه )1976 ,رصت 8 النموذح ثنائی soll‏ - بيتا 
لتطویر مثل هذه الطريقة وثانية تطبیق النتائج معقد Legh‏ ماء ولکن التقریب الدقیق متوفر 


0 


KR )21( KR (21) KR (21) 


وفي هذا التعبير فإن 7 تمثل الدرجة في التوزيع العياري الطبيعي عندما تكون المساحة 

إلى يسارهاء و عبارة عن نسبة خسارات الخطأ الإيجابي إلى الخطأ السلبي. وعلى 
سبيل JL‏ إذا كانت نسبة الخسارة © = 4 فإن 2 هي الدرجة التي تقع مساحة إلى 
يسارها 0.80 وقد استخدم نوقيك ولويس (Siwewis 1974 Wovick)‏ خسارات التصنيف 
الخاطئ ونموذج بيتا ثنائي الحد في تطوير طريقة لإعداد معايير طول الاختبار ودرجات قطع 
التدریج اللاحظ. 
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وفي التطبيقات السابقة لنظرية القرار تم معالجة التصنيف الخاطئ: الخطأ - السلبي 
جمعيها على أنها متساوية الجدية مثل التصنيف الخاطئ : الخطأ السلبي جميعها على أنها 
متساوية الجدية مثل التصنيف الخاطئ الخطأ الإيجابي. 

تتضمن الخسارات من هذا النوع دالة فقدان العتبة (threshold loss Function)‏ لذا فمن 
النطقي الاستفسار Lae‏ إذا كان الخطأ ليس أكثر جدية في التصنيف الخاطئ لمفحوص 
مستوی قدرته الحقيقية بعید fae‏ عن درجة القطع لتدريع النطاق AST‏ مما هو لفحوص آخر 
مستوی قدرته الحقيقية قريبة جدا من درجة القطم. للتوضیح, افترض LSE‏ صنفنا الاطفال فی ۰ 
برنامج تعلیم القرامة. وتجح رالف في هذا الاختبار مع أن درجة النطاق له أقل بقلیل من 
مستوی السيطرة. وکذلك نجحت سوزان في الاختبار ولکن درجة النطاق لها أقل بکثیر من 
درجة القطع. وکان الفقدان الصاحب لقرار الخطأ الايجابي لسوزان آکبر من الفقدان 
الصاحب لقرار الخطأ الايجابي لرالف. 

وإحدى دوال الخسارة التي تعبر عن هذه الأنواع من الخسارات دالة الخسارة الخطية. 
وهنا یکون الخسارة في ball tha‏ - السلبی يساوي Z>(t- toa‏ < وا والخسارة فى 
tha‏ الخطاً السلبي يساوي Cto -Db‏ ودوال الخسارة الخطية هذه موضحة فى شکل )2-18( 
ويبين هذا التمثيل البياني الخسارة أن tha‏ الخطا- الايجابي یوجد فقط لدرجات النطاق 
الأقل من to‏ (أي مفحوصین غير مسیطرین حقیقیین) . والخسارة لخطأ الخطاً - السلبي 
توجد فقط لدرجات نطاق آکبر أو تساوي ما (أي لفحوصین مسیطرین حقیقیین) ولکلا 
النوعین من الاخطاء فان درجة الخسارة تزداد كلما ازدادت السافة بين yt, to‏ اشتق کل 
من فان دير لندن ومیلنبرغ )1977 (Vanderlinden & Mellen bergh,‏ درجة قطع التسدریج 
bo SUI‏ لدوال الخسارة الخطية. 

أن دوال فقدان العتبة والخسارة الخطية ليست الدوال الوحيدة المکن اقتراحها. فأي دالة 
ل t‏ موجبة ولا تزید عن صفر (أقل days‏ نطاق ممکنة) إلى to‏ یمکن أن تخدم کدالة خسارة 
لقرارات الخطاً الايجابي. وبصورة مشابهة الدالة الوجبة لا والتي لا تقل عن to‏ إلى (وهي 
آکبر Lays‏ نطاق ممکنة) يمكن أن تخدم كدالة خسارة لقرارات الخطأ - السلبي . وقد عد 
هونیه )1980 (Hunyh,‏ طريقة تصغیر القيمة الکبری دالة خسارة غير خطية. 

ومن الهم أن یتذکر الطبقتین أن تطبیق نظرية القرار البينة هنا يفيد في |عداد درجة قطع 
تسمح لستخدم الاختبار عمل استدلالات مناسبة عن حالة السيطرة الحقيقية للمفحوصين. 
ومع ذلك فمثل هذه الطريقة لا تقدم توجیهات للقضية الأولى لا يكون عليه مستوی الاداء لحالة 
السيطرة آو الطرائق التي يجب استخدامها لتحدید العیار. 
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الخسارة 





To 1‏ درجة التطاق:. _ 0 
شكل (2-18) توضیح دالة الخسارة الخطية 

كذلك لم نناقش قضية أي دالتي الاختيار سنستخدم. دالة فقدان العتبة أو ذاك الخسارة 
الخطية. كذلك لم نناقش اختيار دالة خسارة بعينها. على سسبيل المثال وضع يتم الخسارات 
في مشكلة فقدان العتبة. بصورة أساسية » يتطلب عمل مثل هذه الاختيارا لتقويم جدية 
الخسارات لكل درجة نطاق محتملة ومناقشة تفاصيل منهجيات مثل هذه الاختيارات خارجا 
عن آهداف هذا الفصل. وعلى القارئ المهتم العسودة إلى دراسة نوفيك ولندلي & (Novick‏ 
Lindley , 1978)‏ المراجع المذكورة فیها. 



























































التمارين: 
(I‏ طبق اختبار مؤلف من )30( فقرة على )2000( طالب وكان المتوسط 18, و =KR21‏ 
6 1513 کانت 270 0.8 Lad Led‏ تقریب هونیه 1 260 . 


Nica ota la = الخلا ای‎ 


3( باستخدام نتائج اختبار افتراضي مؤلف من )7( فقرات . حدد XO‏ ]13 كان الفقد 
thaw‏ الإيجابى )1( والفقد للخطأ السلبى )10( . ssa‏ 0× إذا كان الفقد = 2 و 20 
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على التوالى. أيهما أكثر ضرورة فى التطبيق وضع أخطاء الفقد للخطأ الإيجابي al‏ 
السلبي af‏ النسبة بينهما. 
4( اقرا دراسة راولى الآتية Historical Antecedents of the Standard setting De-‏ 

bate : AnInside Account of the Minimal Beardedness Controversy Pub- 

. lished in the Journal of Educational Measurement , 1982 , 19 , 87-96 

ويعدها أجب عن الأسئلة الآتية: 

أ- هل المتغير المهتم به كان من من الممكن قياسه مفاهيمياً على مقياس متصل أم 
متقطع / نعم أم لا . l‏ : 

ب- زاوج بين طرائق إعداد المعايير الناقشة في هذا الفصل مع تلك المستخدمة في 
دراسة راولي وحدد على الأقل طريقتين من المعروضة في الفصل وفشل روالي في 


تناولها. 
ج- هل من الممكن تطبيق طريقة تحكيم نيدلسكي للفقرة على صيغ الفقرات القترحة في 
الدراسة. 


د- حدد راولی واحد أو أكثر من النقد الرئيس أو القصور لكل طريقة من طرائق إعداد 
pul al‏ طريقة انر وة مجموعاك اهار وتظریة A‏ الفقرع: لكل 
طريقة صف نقد روالي وما مدى جديته فيما لو أسست درجة قطع لاقل كفاءة 
شبادة تافيل العلمين المبتيكين. 

هب من وجهة نظر نتائج راولي (وکما دونت في جدول 1 في هذه المقالة) هل من المنطق 
أن زيادة صدق المحتوى للفقرات (آو ملائمتها لنطاق مهم) يزيد من أقل درجة نجاح 
موصى بها لمجموعة الفقرات هذه. كيف تفسر هذه النتائج لدراسة راولي؟ 
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الفصل التاسع عشر 
المعايير والدرجات المعيارية 

ناقشنا في الفصل السابق الاختبارات محكية المرجع التي تهدف لان يكون للدرجات الخام 
معنى مفسر ومباشر. وفي العديد من الحالات من الصعب إجراء تفسيرات مفيدة أو 
استنتاجات من درجات المفحوصين الخام وحدهاء وفي هذا الفصل سنعرض طرائق تدعم 
تفسير درجات الاختبار من خلال استخدام المعايير. وفي الحقيقة فإن الدرجات المعيارية 
جمیعها تزودنا بمعلومات عن أداء الفحوصین مقارنة بتوزيع درجات عينة معيارية معينة أو 
مجموعة مرجعية. وبالتالي فإن معنى الدرجات يعتمد على 1) gall‏ الذي يهتم مطور الاختبار 
من خلاله مقارنة الفحوصین بالجتمع المعياري 2) ومدى ملائمة العينة المعيارية لتمثيل 
الجتمم. ۱ 

وفي البداية من الهم تمییز - ولبعض مستخدمي الاختبارات إن الاکثر ملائمة هو مقارنة 
آدام الفحوصی باداء مجموعة الرفاق العيارية (مثل الفحوصین النین تقدموا للاختبار نفسه 
في الوقت نفسه) فاستخدام مجموعة الرفاق العيارية یکون مناسباً مستخدم الاختبار الذي 
يريد تعبنة شواغر یختارها من مجموعة متقدمین للوظيفة أو العلم في الصف الذي برغب في 
اعطاء درجات تعتمد علی الاداء النسبي لطلبة فى الصف الحالي وفي الفصل الدراسي 
الحالي. بالقابل» یبدی اقل متطفية: وضع الطفل فى برنامج علاجي ure‏ او عناية صحية 
رهق مرک ال وال خی اماه على جوع معينة من Orca gill‏ تام 
للاختبار في الیوم نقسه. لهذه الاهداف ما پساعدنا هى إمكانية مقارنة توزیع درجات الاختبار 
لعينة مفحوصين تمثل الجتمع المحدد بشکل جید. ففي مثل هذه الحالات يجب وصف عينة 
العايرة وصفاً Lads‏ بتفصیل HS‏ بالنسبة لخصائصها الدیموغراقية (مثل الجنس, والسلالة 
أو الخلفية العرقية. والجتمم أو النطقة الجغرافية والحالة الاجتماعية الاقتصادية, والخلفية 
التربوية) وذلك لتسمح لمستخدمي الاختبار تقییم ما إذا كانت القارنة ذات معنی مقارنة بأداء 
الفحوصین بمجموعاتهم المعيارية. وفي بعض الواقف یفضل مستخدم الاختبار تطریر معاییر 
اعتماداً على آداء مجموعة معيارية محلية. وفي هذه الحالة یقم على عاتق مستخدم الاختبار 
ی ای متا غیت محا یه مفاسية aly‏ كزيل Sl Galt‏ التاسبوستقي فى هذا dai‏ 
بشی قافن Sse‏ الناسكة او فقاو EAN‏ او peas‏ كلاثما الاد الیو 








الأداة التشودة. ويعدها سنراجع تحويلات الدرجات الشائعة المستخدمة في مقارنة درجة 
الفحوص الخام بتوزيع عينة المعايرة. 
إجراء دراسة المعايرة: 
بشكل ale‏ الخطوات الأساسية الموصى بها لإجراء دراسة المعايرة متشابهة عموماً بفض 
النظر Lec‏ إذا كانت المعايير محلية أو باستخدام موسم. وهذه الخطوات هي: 
1. حدد المجتمع الذي تهتم بوضع معايير له (مثل طلبة المدارس العامة جميعها لإحدى 
الولايات أى المتقدمين للقبول في برنامج دراسي معين أو وظيفة معينة). 
2. حدد الإحصائيات الأكثر أهمية التي سيتم حسابها لبيانات العينة (مثل المتوسط 
والانحراف المعياري والرتب الئینیة). 
3. قرر القدر السموح به من Ud‏ للعاينة (الفجوة بين تقدیر العينة ومعلم الجتمع) لواحد 
أو أكثر من الاحصائیات الحددة في الخطوة 2 (آهمها تحدید خط العاينة للمتوسط). 
4. اقترح طريقة لاختیار العينة من الجتمع (وسیتم وصف عدد من استراتیجیات العاینة 
في الجزء التالي). 
5. احسب اصغر حجم tise‏ مطلوب لجعل خطأ العاينة ضمن الحدود المخصصة: وهنالك 
العدید من الصیغ يجب استخدامها والتي تعتمد على استراتيجية العاينة الستخدمة. 
6 اختر العينة واجمع البیانات. ووثق آسباب أي انتهاك قد یظهر. وعند ظهور انتهاك 
[ساسي مثل تعذر اشتراك مدرسة GIS‏ بعد إن تم اختیارها في العينة. فمن الضروري 
استبدال هذه الوحدة باخری يتم اختیارها بطريقة العاينة نفسها. 
7. احسب قيم احصائیات الجموعة وأخطائها العيارية. وفي التطبیقات العملية فان الخطأ 
العياري للمتوسط هو الدون على الاغلب. 
8. حدد آنواع الدرجات العيارية التي تحتاجهاء واجلب جداول تحویل الدرجات المعيارية 
اللازمة. 
9. أعداد وثيقة مكتوبة لطريقة العايرة والارشادات لتفسیر الدرجات العيارية. 
المعاينة الاحتمالية: ۱ 
تدون البیانات العيارية لدرجات الاختبار أحياناً بالاعتماد على بیانات عینات مناسبة 


من alsa‏ العف التتظم الای gle hs di‏ اداء التحرصية: على مين الال اقوت 
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التطوعین للاشتراك في معايرة استبانة مفهوم الذات قد يختلفون بانتظام في مفهوم الذات عن 
غير المتطوعين. إضافة إلى إن مثل هذه العينات لم يتم اختيارها لتمثل أي مجتمع؛ فان 
استخدام احصائيات مثل الخطأ المعياري للمتوسط لتقدير درجة الخطأ المحتملة في التقديرات 
لا یکون لها معنى. بالقایل عندما يستخدم مطور الاختبار عينة احتمالية لجميع بيانات 
العايرة, فان فرصة التحيز المنتظم الذي يؤثر في الأداء على الاختبار منخفض, إضافة إلى 
انه من المکن تقدير كمية خطأ المعاينة الناسب الذي يؤثر على الاحصائيات المحسوية الختلفة 
من هذه الدرجات. وببساطة تعرّف العينة الاحتمالية على أنها عينة يكون لكل فرد في المجتمع 
احتمالية معروفة لان يشتان ضمن العینةء والصيفة الابسط المعاينة الاحتمالية (ومي التي 
تقارن بها الأنواع الأخرى عادة) هي المعاينة العشوائية البسيطة. .~~ 

والمعاينة العشوائية البسيطة قد تشبه عملية تعيين رقم خاص JS‏ عضو في المجتمع, 
وكتابة كل رقم على قطعة ورق منفصلة ووضع قطع الورق جميعها في asd‏ ويسحب من 
القبعة عدد معين من الأوراق» وكل مفحوص يختار رقمه في هذه العملية يتم اختیاره للعينة. 
وفي الواقع يتم اختيار نقطة بدء من جدول الأرقام العشوائية ويختار كل مفحوص يظهر رقمه 
حسب تتابع القائمة حتي يصل الباحث إلى العدد المطلوب من أفراد العينة. 

وعندما تحسب قيمة متوسط الدرجات (أو أي إحصائي آخر) لعينة العايرة, فإنه يعد . 
تقديراً لعلم الجتمم» ومثل هذا التقدیر يكون خاضعاً thas‏ العاينة. وعندما تتکرر سحب 
عینات عشوائية من مجتمع معین وسحب متوسط كل عينةء فمن المکن وصف التوزیع 
التكراري لتوسطات العینات حول قيمة واحدة لتوسط الجتمع. وبالعودة إلى نظرية العاينة 
فان هذا التوزیع یقترب من المنحنى الطبيعي. والانحراف العياري لهذا التوزيع لتوسطات 
العينة يطلق عليه الخطأ العياري للمتوسط. سنرمز له بالرمن OM‏ وهذه الکمية تفيدنا عندما 
ترود تخصیص فترة حول التوسط وبدرجة معینة من الثقة والتوقع آن یکون متوسط الجتمع 
ضمنه. ومن الواضح أنه كلما كانت الفترة اصغرء كلما كان الحکم على تمثیل عينة العايرة 


ويمكن حساب قيمة OM‏ من بيانات عينة واحدة من خلال الصيغة D‏ 


(1) تستخدم هذه الصيغة عندما يكون pao‏ العينة كبيراً حتى يمكن اعتباره يصل إلى اللانهاية, وعندما تتم المعاينة من مجتمع 


ON) ۱ ينو‎ 
N N - 


حيث N‏ هو عدد الحالات في للچتمم. وفي معظم دراسسات المعايرة فإن التصحيح لمجتمع لانهائي غيسر ضسروري. 
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2ئ 
GAD) ects es /— =%‏ 


حيث ترمز OF‏ إلى تباين درجات العينة )2( وه هي حجم العينة. وواضح أن محددي 
انخفاض OM‏ لستوی ثابت من التباين shag‏ حجم العينة. وكيف يزداد لحجم عينة معين 


جدول (1-19) الأخطاء المعيارية للمتوسط لعينات مختلفة في تباينها وحجمها. 





العينة اللازم لتحقيق مستوى معين من خطأ المعاينة, وعندما يستطيع مطور الاختبار 
تخصيص الكمية المسموح بها من الخطأ فى المتوسط المحسوب لعينة المعايرة: GLE‏ يمكن 
اه هذه العلويات فى ية الخطا العیاری egal‏ لهاب استقی سم رون 
العينة. لذا ففي اختبار تحصيلي مؤلف من 80 فقرة فقد يرغب مطور الاختبار أن تكون درجة 
الثقة 95ء وهى إن أي تقدير للمتوسط يقغ ضمن )14( نقطة لمتوسط الدرجة التي يمكن 


على l-n‏ لا على 1 
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الحصول عليها فیما لو اختبر المجتمع باکمله. وهذا يعني أن نقطة التقريب تنتشر إلى Ome‏ 
ويجب أن تكون أقل أو تساوي )1.00( وبالتالي OM OB‏ = 0.5 ولتحديد اصغر حجم للعينة 
يلزم للحصول على درجة الدقة هذه فمن الضروري إن يكون لديك بعض الفكرة عن قيمة 
الانحراف المعياري لدرجات الاختبار (وهذه العلومات يمكن الحصول عليها من خلال بيانات 
اختبار دليلي ابتدائي خلال جهود التطوير المبكرة آو من خلال عمل تخمين تربوي يعتمد على 
معرفة كيفية الأداء على اختبارات مشابهة من هذا النوع). افترض الآن أن مطور الاختبار لديه 
بعض الأسباب ليتوقع إن الانحراف المعياري على الاختبار التحصيلي هذا (المؤلف من 80 
فقرة) سيكون 10 نقاط. وبتعویض هذه القيمة في المعادلة )1-19( وحلها nt‏ لدينا =n‏ 
ae‏ - 400 لذا فإننا نحتاج عينة على الأقل مؤلفة من (400) فرد للحصول على درجة 
الدقة المرغوية لتوسط المجتمع من تقديرات العينة. 
وفي بعض دراسات المعايرة من المستحيل سحب عينة عشوائية بسيطةء واختبار كل 
ae ies‏ الطريقة. فعلى سبيل المثال ففي معايرة اختبار تحصيلي مقنن ليس من 
السهل أن تؤلف قائمة بأسماء طلبة الصف الثامن في الولاية وتختار بعضها عشوائياً لتطبيق 
الاختبار عليهاء ويمكن تصور أن خطة المعاينة هذه قد تجعل الفاحص يزور عدد اكبر من 
Gull‏ والمدارس والغرف الصفية في الولاية ويختار عشوائياً بعض الأفراد للاختبار. ولأهداف 
معايرة أخرى فان المعاينة العشوائية البسيطة قد لا تسمح للفاحص بضبط تركيب العينة 
لبعض المتغيرات المهمة والمناسية. لذأ فإن بدائل العاينة العشوائية البسيطة قد تكون ملائمة 
احیانا. 


المعاينةه المنتظمة: 

تستخدم عندما يكون الأفراد مرتبين في قائمة, وهذا الترتيب غير مرتبط بالسمة الراد 
قياسها (مثل الأسماء فى دليل الهاتف)» ويحدد الباحث نقطة بدء عشوائية من القائمةء وان 
كانت نسبة المعاينة المراد اختيارها /1 من الجتمم» فان كل فرد له الترتيب K‏ في القائمة. 
ومن نقطة البدء المحددة يتم اختياره. وإذا وصل الباحث إلى نهاية القائمة قبل اختيار عدد 
آفراد العينة الكلي. ببساطة يذهب إلى بداية القائمة ويستمر في اختيار كل فرد له الترتيب K‏ 
وتفيد المعاينة المنتظمة بشكل خاص عندما لا تتوافر قائمة بالأقراد كما هو الحال في مسح 
التسوق, إن إن كل متسوق ترتيبه . يتم اختياره في العينة بمجرد دخوله إلى المؤسسة أو 
يشتري منتج معين: ويمكن تطبيق هذه الطريقة في العاينة في الحال لاختيار عينة المرضى أو 
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المسترشدين الذين يحتاجون برامج تشخيصية a‏ علاجية أو إعادة «ha‏ وان كان من الممكن 
افقراض إن Uae‏ الاقراد ترتییهم غشوائى بالاساس على التغین قید Deal yall‏ فان الخطا 
العياري لإحصائيات العينة يمكن تقديرها كما لو أنها عينة عشوائية بسيطة. 


العينة العشوائية العنقودية: 

تشبه المعاينة العشوائية البسيطة: ولكن يقرر الباحث مسبقاً إن العينة يجب إن تتضمن 
خصائص معينة لأنواع خاصة من المفحوصين. على سبيل الثال يرغب الباحث التاکد من إن 
العينة المختارة تالف من %50 ذكور و %50 إناث أو %70 بيض و 9030 سود. فان كانت 7 
تمثل العينة الكلية فسيتم اختيار عينات الذكور والإناث في هذه الحالة باختيار عدد كلي 
يساوي )0.50 (nx‏ ذكور (m x0.50)‏ إناث وان كانت العينة 9670 بيض و %30 سود و 9050 
ذكور و %50 إناث لكل مجموعة عرقيةء وكان حجم العينة n‏ فإن الباحث يختار 

إحدى العينات العشوائية = 0.30 × 9050 أو0.15 n‏ ذكور سود 

واحدی العینات العشوائية = 0.30 nx 0.50 x‏ و 0.15 n‏ انات سود 

واحدی العینات العشوائية = 70. n × 0.50 x‏ آو 0.35 n‏ ذکور yes‏ 

ولحدی العینات العضوائية = 0.70 0.50 ه n 0355) ١‏ انات بیض. 

وقد تکون العاينة العضوائية العنقودية مفضلة على العاينة العشوائية البسيطة لسببین, 
الأول لظهور العاينة العنقودية عندما یکون التغیر مؤلف من طبقات وترتبط بالأداء على 
الاختبار.افترض على سبیل JEU‏ لاختبار العلاقات الكانية أن هنالك اتجاه لان تکون درجات 
الذکور آعلی من SLY‏ وان النسب المؤلفة للمجتمم الأصلي تتالف من %70 ذکور و9030 
إناث في الجتمع الذي نهتم به. فإن سحبت عينة عشوائية تحوي %80 ذکور و 9620 انا 
فإن متوسط العينة سیکون اکبر من القيمة القدرة متوسط الجتمع. وان تم اختیار عينة 
Llp aie‏ بسیظة تم 9050 ذکوری ABE‏ فان متوسنط Tall‏ ستکون all Ua)‏ قان 
سهبت عينة عنقودية ANTS‏ من 9690 ذکور و 9630 اناث فان هذا سیزید من آرجحية 
الحصول على متوسط عينة قريب من متوسط الجتمم. ویمکن لطور الاختبار في العينة 
العنقودية ان ينتج معاییر thas‏ معاينة أقل من تكلفة العينة العشوائية البسيطة نفسها 
وبحجوم متقارية, وبشکل آخر فإن التقدیرات من استراتیجیات العاينة الائنتین تتساوى فیها 
كمية الخطاء ولکن العاينة العنقودية ذات كلفة آقل. وبشکل عام يفضل استخدام العاينة 
العنقودية عندما یکون تباین درجات الفحوصین ضمن الطبقة الواحدة اقل من تباین الجموعة 
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الكلي. كذلك فإن عينة المعاينة العنقودية تعكس التركيب الديموغرافي للمجتمع الذي يتسم 
بمصداقية اکبر من قبل مستخدمي الاختبارات فعلى سبيل المثال حتى في حالة عدم وجود 
اختلاف في آداء الطلبة الذكور والإناث في اختبار الاستعداد الأكاديمي للأطفالء فان 
مستخدم الاختبار يكون AST‏ ارتياحاً عند مقارنته لدرجات المفحوصين على معيار يعتمد على 
عينة مؤلفة من %50 ذكور و %50 اناث أكثر مما لو كان معتمداً على استخدام مجموعة 
معيارية تتألف من 9675 ذكور و %25 sli]‏ والتي لا تعكس الجنس في المجتمع العام. 

وعندما تستخدم عينة عنقودية لمعايرة الاختبار فان متوسط العينة يطلق عليه أحيانا اسم 
التوسط الوزون, والخطأ المعياري لهذا المتوسط يحسب ب: 


13 l ce OMw 


A الخطاً المعياري لتوسط الطبقة‎ alls يرمز‎ OMh 


وعندما يتجمع الأفراد معاً في تجمعات طبيعية أى وحدات تن تنظيمية fie)‏ الغرف الصفية: 
الصانع, الستشفیات» الأحياء السکنیة) فمن المکن بناء عينة ة باختیار ما الب من هذه 
olan‏ وفي العينة العنقودية ذات المرحلة الواحدة, فحالا يتم اختيار الوحدة فإن جمیع 
الأفراد فى تلك العينة يصبحوا من أفراد العينةء وسنحدد اعتبارنا هذا إلى الحالة التي يريد ٠‏ 
لفاحص بها معاينة التجمعات بطريقة يكون لكل تجنع احتمالية مقساوية في اختیاره ضمن 
العينة. ولسحب العينة فان الفاحص قد یژشر لكل تجمع آو طبقة بارقام من (1 إلى ) ویتم 
اختیار التجمعات فیما بعد باستخدام جدول الأرقام العشوائية بالطريقة نفسها التي 
استخدمت العاينة العشوائية الیسيطة فى اختیار الافراد کوحدات منفصلة. وعادة یختلف 
حجم التجمع من طبقة لاخری, وقد اقترح لورد )19598 (Lord,‏ أن الصيغة اللائمة لحساب 
thal‏ العياري في هذا الوقف هو : 





)3( عندما تکون العاينة من مجتمع لا نهائي» فان الصيغة تعدل إلى: 


EDO WHS فييك با‎ 


حيث تعنى fh‏ إلى كسر العاينة أو ذنسبة الفحوصین الذین اختیروا من الطبقة wh‏ 
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TA ۴ NE‏ امات E E‏ إلى الاتصراف lial‏ 2 ا 
الجموعة. Oy‏ إلى الانحراف المعياري لحجم الجموعة» و fim‏ إلى متوسط حجم الجموعة, 
وفي حالة كون المجموعات جميعها متساوية في الحجم فإن Oy‏ تحسب ب : 





ويكون المفحوصين ضمن المجموعة (مثل الصف) عادة AST‏ تجانساً من المجتمع ISH‏ لذا 
فإن متوسط dire‏ المفحوصين لعدد قليل من المجموعات يكون آبعد عن متوسط المجتمع من 
التوسط الذي بعتمد علی أعداد متساوية من الفحوصین alll‏ سحبوا بالماينة العشوائیة 
البسيطة. وذا آراد مطور الاختبار الحصول على احصائیات معيارية لعينة عنقودية لها خطا 
معاينة مشابه U‏ تم الحصول عليه من العبنة العشوائبة البسیطة لحجم chee Rizo‏ فعلیه إن 
يختار في حالة العينة العنقودية عدد اکبر من الأفراد. ووضح لورد )11959( إن العاينة 
العنقودية في دراسة العايرة لاختبار مقان تتطلب اختبار مفحوصین یتراوح عددهم ما بين 12 
الی 30 ضعف الحصول علی تقدیرات معيارية WG‏ العقارنة (مقاربة) فی الدقة لاسفدوصین 
الختارین بناء على العاينة العشوائية البسيطة. ويجب ملاحظة إن الفعالية الاکبر في العاينة 
العنقودية یمکن تحقیقها بحیث تکون فرصة اختیار کل مجموعة پتناسب مع حجمها» وقد 
وصف جايجر Jaeger,1984)‏ طرائق المعاينة وزودنا بصیغ للحساب في أسلوب المعاينة 
العنقودية هذه. ۱ 

ولان الأخطاء العيارية لاحصائیات التقنبن تکون عموماً اقل بزيادة عدد الطبقات 
N‏ حت ان بط Gat‏ اتات من اکن فوا سكن من اطفات اح 
الطرق aa‏ التكلفة Salty) Cal oll GIS‏ إمكائية الحصول علی مدع اسخمایات افضل 
من الوهدات (AS LM‏ من خلال العاينة متعددة الراحل, والتی توضم بسهولة کبيرة من 
خلال العاينة ثنائية الرحلة. افترض إن مطور الاختبار كان مهتماً في تطویر معاییر لقاطعة 
a‏ لاخشای الاسشدان الاکانیسی اق فرنیاً ع الطلبه فی مستوی تراسی مقن واخته 
لا یستطیم اختبار طلبة القاطعة جمیعهاء هنا یمکن استخدام تصمیم العاينة ثنائية الرحلة 
وتکون كما يأتي: 
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2 ضمن كل مدرسة اختيار نسبة ثابتة من الفحوصین Wis)‏ %5( وهذه الطريقة تمنم 
كل ORT‏ قر سان لالجا ولكن اتکی على إن الدارين اک قن 
اكبر في العينة من الدارس الصغيرة, ويتأثر الخطأ المعياري للمتوسط للعينة ثنائية 
الرحلة يخا التباین الذي یعود إلى معاينة الدارس وخطا التباین الى 
يعود إلى معاينة الأفراد ضمن الدارس» thay‏ التسباین الذي يعود إلى معاينة 
الأفراد ضمن الدارس, يمكن حسسابه ب مف (انظر العادلة 3-19)» وقسد 
حسب کل من انغوف )1971 (Angoff,‏ ولورد (lord, 1959a)‏ خطأ التباین الذي يعود لمعاينة 
الافراد ضمن الجموعة باستخدام صیغ مكافثة ل : 


x PED 
[ty pk 
وفي مثالناء أ ترمز إلى نسبة الطلبة الذين تم اختيارهم من كل مدرسةء كلب هي عدد‎ 
المدرسة‎ ae المدارسء ولا هي متوسط حجم المدرسة: 0,2 هي تقدير لمتوسط التباين‎ 
للمجتمم, لذا.فان الخطأ المعياري للمتوسط لهذه العينة ثنائية المرحلة هو:‎ 
e cen: mp + U c= Om 


aE a cee Ga,‏ وکا نامیا 
المرحلة للمجموعات والافراد. أسلوب اخر ممكن هو اختيار dire‏ المجموعات من المدارس 
بطريقة معينة یکون فیها فرصه اختیار المدرسة یتناسب مع حجمها ویعدد متساوي من 
التلاميذ الذين سيختيرون من كل مدرسة, وقد وصف انغوف (1977) طريقة å‏ عملية في اختیار 
fis‏ هذه العينة ثنائية الرحلة. كذلك فان كل من انغوف ولورد قدما صيغة لحساب الخطاً 
العیاری لتوسط مثل هذه الات ALAM ys‏ الرئيسية هنا انه بحث علی الق ان بحيو أنه في 
كل مرحلة من المراحل المتتالية في عملية المعاينة يضاف عنصر خطأ تباين يؤثر على متوسط 
الخطاً المعياري. وعندما تكون المجموعات المستخدمة سليمة في تركيب عينة العاییر فإنه لا 
يجب معالجتهم على أنهم عينة عشوائية من الأفراد سحبت من المجتمع إضافة إلى أن 
الستراتيجيات الختلفة لعاينة المجموعات والأفراد تتطلب صيغاً مختلفة لتقدير الخطأ ويمكن 
الإفادة من مرجع كيش )1965 (kish,‏ في بناء عينات متعددة المراحل. 


وصف دراسة المعايرة فى دليل الاختباره 


على مطور الاختبار مسؤوليات عديدة فى وصف نتائج دراسة المعايرة. الأول يجب وصف 





عتمي سيت wm samaan 2 tat‏ یر ره لت AR aaas‏ يداه Meman natn‏ مد بويا a‏ بنصي Mmmm e maa n n eataa omae‏ سم محم بعت حسمي سمالت 


اختیرت بوساطتها عينة المعايرة وهذا يتضمن بالتاكيذ وصف تفصيلي لخطة العاينة Sis)‏ 
نوع المعاينة المستخدم» وتحديد الطبقة في المعاينة الطبقية, ونسبة المعاينة لكل طبقة. وعدد 
المجموعات المختارة). وكاقتراح عام يجب أن يكون وصف خطة المعاينة شاملا لدرجة كافية 
بحيث يمكن استخدم الاختبار أن يحسب الخطأ المعياري لإحصائيات (غير تلك المدونة في 
الدليل). 

وفي وصف طريقة المعاينة فمن المهم الإشارة إلى مدى الرفض أو عدم الاستجابة عبر 
وحدات المعاينة الأصليةء ولتفسير التأثيرات الحتملة. ومثل هذا الرفض لا يمكن تعميم نتائجه 
من العينة إلى المجتمع. فعلى سبيل المثال مع أن دليل اختبارات ا ميتروبوليتان التحصيلية 
(prescotietal, 1978)‏ يشير إلى أن أكثر من 550.000 طالب اشتركوا بشكل ما في المعايرة 
وشار باغلین Bagling,1981)‏ إلى ان ما مجموعه 88 مدرسة من القاطعات وافقت بالفعل على 
الاشتراك بعملية للعايرة. إلا إن هذه القاطعات تتضمن %32 فقط من القاطعات التي تم 
دعوتها للاشتراك في دراسة العايرة الوطنية: (مدی مشابه أو آقل من الشترکین تم تدوینه في 
معايرة اختبارات تحصيلية اساسية اخری خلال الفترة نفسها). إضافة إلى إن الرغبة 
للاشتراك فى دراسة معايرة لناشر معين يبدو آنها تتأثر بسلسلة الاختبارات التحصيلية التي 
قستخدم في الوقت نفسه في القاطعة. لذا تساءل باغلین عما إذا كان من النطق وصف مثل 
هذه العاییر على آنها في الحقيقة تمثل معايرة وطنية, مقترحاً على ناشري الاختبارات بان 
یکونوا آکثر شمولاً في وصفهم لماهية بناء أو ترکیب عینات العايرة. 

معلومات آخری حاسمة يجب تدوینها تتضمن تاريخ دارسة العايرة مع الوصف لترکیب 
العينة العيارية من خلال الجنس والخلفية العرقية أو السلالة. والحالة الاجتماعية الاقتصادية. 
والموقع الجفرافي, وأنواع الجتمعات الممثلة - حینما یکون مناسباً - وأي ظروف خاصة طبق 
الاختبار تحت شروطها فیجب ذکره. فعلی سبیل المثالء إذا كانت عينة العايرة لامتحان 
الكقاءة التخصصية تتالف من التقدمین لامتحان الكفاءة والذین لزم تطبیق الاختبار علیهم 
على آساس تجريبي فقط (لذا لا تؤخذ درجاتهم بعین الاعتبار في قرار الكفاءة فمستوى 
دافعیتهم وبالتالي اداء‌هم الاختباري قد یکون أقل من الذین سیختبرون لاحقا والذین يجب إن 
تا روا SER‏ لتحاو على الكقاءة 

ویجب آن برافق لحصائیات الجموعة الدونة لوصف آداء العينة العيارية علی الاختبار 
(مثل التوسط والانحراف العياري) معلومات تشیر إلى دقة تقديرات العينة. فعلى الأقل يجب 
تدوين الخطأ العياري للوسط یصاحبه فترات درجة نقة معينة تتضمن متوسط الجتمع ‏ 
لستویات مختلفة من الدقة. وقدم انفوف طريقة تجريبية لتقییم ما |ذا كان الخطاً العياري 
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للمتوسط ضمن حدود منطقية باقتراحه أن الخطا عند التورسط يعود إلى تجمیم خط العاينة: 
وان thal‏ العياري للاختبار يجب أن لا یتجاوز الخطا العياري للقياس باکثر من %1. 

آخیراء يجب إن یتضمن دلیل الاختبار تفسیرات واضحة للمعاني. والتفسیرات الناسبة 

لكل نوع من تحویلات الدرجات العيارية. وهنا یفضل الاشارة إلى كم التغير التوقع لكل نوم 

من الدرجات بسبب اخطاء القیاس والتحولات fhe‏ الرتب الثینية یچب توضیحها عند تقاط 


آنواع الدرجات العيارية 


تذکر إن معظم حالات دراسة العايرة تجري بهدف بناء جداول تحویلات بحیث إن قيمة 
درجة خام معينة يمكن تفسیرها من خلال موقعها النسبي وتکراراتها ضمن توزیع الدرجات 
الکلی وسنصف فى الأجزاء التالية الأنواع الشائعة من الدرجات العيارية مع تبیان ما يجب 
إن يؤخذ بالحسبان عند تفسیرها. 
الرتب المئينية 

مجمل القول إن الرتب المئينية المناظرة لدرجة خام معينة تفسر على أنها نسبة المفحوصين 
في مجموعة المعايرة الذين تقل درجاتهم عن هذه الدرجةء وحسابياً تحدد الرتب المئينية على 


أنها : 
Gea % 100x raa‏ 
N‏ 
حيث ترمز Ca‏ إلى التكرار التراكمي للدرجات جميعها التي تقع دون الدرجة» و 5 إلى 
تكرار الدرجة الراد حساب رتبتها المئينية» No‏ إلى عدد أفراد العينة» وخطوات حساب الرتب 
1 تكوين جدول تكراري للدرجات الخام كما في جدول (2-19). 


2/ ولدرجة خام معينة. حدد التكرار التراكمي للدرجات التي تقع دون الدرجة العينة (فإن 
oh Ga‏ رنه SEN DE‏ الدرجه 17 من شاتات Mpa‏ )2-19( فعیتا عدي 
التكرار التراكمي للدرجة 16. 














جدول (2-19): التوزيع التكراري للدرجات الخام 
والرتب الثينية والدرجات الخطية والدرجات الزائية المعيارية القياسية 









aaa CaS لب‎ ISLS ESI ORS oS REI TSR قاد هد سک هت وه ال‎ aan naa arera 


2.74= 6X . 17.94 مقربة لأقرب منزلتين عشريتين.  پلا:‎ (a) 
2 أضف نصف تكرار الدرجة المراد حساب رتبتها المثينية في الخطوة‎ .3 
والرتبة الئينية الناظرة للدرجة الخام 17 في جدول (2-19), تحسب كما يأتي:‎ 
21( 0.5 + 3 
36 =% 100 x Conta eis 
150 
نصف عدد الفحوصی الذين حصلوا على الدرجة‎ ARG لغاية الآن ليس واضحاً لماذا‎ 
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وتقليدياً تعد السمة المقيسة في الاختبار متصلة القيم (تقع على تدريج متصل)ء لذا فان كل 
قيمة للدرجات الخام تناظر فترة للدرجة على متصل القدرة آو السمة المقيسة؛ وتتركز نقطة 
الاهتمام على وسط هذه الفترة. ونظرياً فإن نصف المفحوصين الذين حصلوا على درجة خام 
معينة تعد درجاتهم على السمة اقل من نقطة وسط الفترة. والنصف الآخر تعد درجاتهم أعلى" 
من نقطة وسط الفترة. لذا فإنه عند حساب الرتبة المئينية فإننا نحسب (نعد) عدد الملفحوصين 
الذين هم دون نقطة وسط الفترة (أي نصف عدد الفحوصین الذين حصلوا على الدرجة الخام 
نفسها). ۱ 

ویوصی باستخدام الرتب الثينية عند ایصال نتائج الاختبارات معيارية الرجع إلى 
التلامیذ والوالدین والرشدین. فإذا افترضنا أن مجموعة الفحوصین هي مجموعة معيارية, 
وتمت مراقبة تطبیق الوقف الاختباري ووقت الاختبار بعناية, فإنه يمكن توضیح التفسیر 
الملائم بهذه الصيغةء درجة جين في الاختبار أعلى من 675 من الجموعة العيارية, ومع انه 
يوجد عدة محاذیر يجب إن LAS‏ بعين الاعتبار عند تفسیر الرتب الثينية. فمعظم أخطاء 
التفسیر تظهر عندما يفشل مستخدم الاختبار تمييز إن تدریج الرتب المئينية هو تحویل غير 
خطي لتدریج الدرجات الخام. ويبساطة فهذا يعني انه على الناطق الختلفة من تدریج الدرجة 
الخام كسب نقطة واحدة يناظرها كسب مختلف القيمة على تدریج الرتب الئينية. 

للتوضیم. دعنا نتفحص جدول (3-19) الذي یتضمن أمثلة لدرجات خام وقیم الرتب 
الثينية الناظرة وذلك لاختبار تحصيلي في الریاضیات للمرحلة الأساسية, الخطاً العياري 
له =3 نقاط تقريباً. وبالتالي فإن العمود الرابع من الجدول یتضمن فترات الدرجة الخام 
الناظرة ل: (Loge x)‏ لاحظ انه عندما یتساوی عرض الخلایا لقیم الدرجات الخام جمیعها 
فان فترات الرتب الثنية الناظرة تختلف اختلافاً ملحوظاً بالاعتماد على موقع الدرجات الخام 
في التوزيع. ويظهر هذا لان التكرار النسبي a‏ للدرجات في وسط gani, gaal‏ 


۸ إن ae‏ 5 المثينية أقل | ee‏ (ثباتاً) للدرجات daa‏ مرکز er‏ 
Cas I‏ فوع الإطراك: شعلى سل الخال فى O19) jee‏ قرى إن فرجة 
مفحوص متوسط القدرة قد تتغير ب 12 رتبة مئينية وتبقى غير متجاوزة للخطأ المعياري 
للقياس» قى حين إن الزيادة نفسها فى الدرجة الخام لفحوص عند مدی القدرة العلوي 
ينتج عنه تغير قدره خمس رتب مئينية» ومع ذلك فإن نطاق المئين (هى نطاق الرتبة 
الثينية الناظرة للتقاط ‏ + (log‏ لا يزال مفيد في تفسير الدرجة. ومثل هذا النطاق 
للرتبة الئينية مبين في أقصى عمود إلى اليمين في جدول (3-19). 

2 ان الکسب ای الخسارة فى الرتب الئينية للسفموصین المتفردين لا یمکن مقارنتها 
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معنویاً لفحوصين عند نقاط مختلفة من التوزيع. فعلى سبيل المثال» افترض ان التلاميذ 
في برنامج تجريبي اكتسبوا جميعاً )3( درجات خام في الاختبار البعدي مقارنة 
بدرجات الاختبار القبلي. هنا مقارنة الكسب من خلال الرتب المثنية يؤدي إلى استنتاج 
غير ملائم وهو إن فئة المفحوصين ذوى القدرة الأعلى كان اثر العالجة عليهم اقل مما 
هو للمفحوصين في وسط التوزيع إذ أنهم حصلوا على اكبر قدر من الكسب 

3 لا يمكن تفسير الحسابات الرياضية والإحصائية لدرجات الرتب المئينية بمعنى أو 
هدف في بعض المواقف. 


جدول (3-19): توضیح للدرجات الخام والرتب الشدنية 
ونطاق الرتب المئينية لاختبارتحصيلي في الریاضیات في المرحلة الأساسية 





(1) : 8© تقریباً = 3 نقاط. 

افترض على سبیل الثال أن الباحث آراد مقارنة متوسطات مجموعتین. وقد یختلف 
الاستنتاج حول آداء الجموعتین فیما لو استخدم متوسطات الرتب الثينية بدلاً من استخدام 
الدرجات الخام» ویمکن رژية هذا من خلال مثال بسیط لبیانات Jose‏ )2-19( افترض أن 
المجموعة أ تألفت من مفحوصين اثنین درجاتهم الخام )12 , ۰)20 والجموعة ب تألفت من 
متوسطات درجات الرتب الثينية الناظرة مختلفة اختلافاً ملحوظاً )40.5 للمجموعة أ» و24.5 
للمجموعة ب). لذا فان الاعتماد على متوسط درجات الرتب المئينية يعد غير مناسب لقارنة 
للجموعتین. 


الدرجات الزائية المعيارية : ۱ 
مع òl‏ معظم توزيعات الدرجات الاختبارية ليست طبيعية بشکل مطلق (LORD,1955)‏ الا 
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ان فاك تقض الس نات تخس ترا الاستباز tha‏ ها cle‏ مضاریة EE‏ 
على الاعتدالية (التسوية الاعتدالية) لتوزيع الدرجات الاصلي. إن ملائمة أو مناسبة تدریج Z‏ 
العياري انه وبغض النظر عن عينة الاختبار و الفحوصینء GLa‏ پوجد لكل نقطة علي التدریج 
نسبة مئوية ثابتة للحالات التي تقع أعلى أو أدنى من تلك النقطةء ویمکن الحصول على قیم 
الشسب او من جداول درجات:2 te heal!‏ ویتم المصول علی درجات Z‏ المیارية باجراء 
تحویل غیر خطي للدرجات الخام الاصليةه ویخلاف dapat‏ درجات Z‏ الخطیة (الذگورة في 
لقصل التي تحتفظ بتوزیع الدرجات الا old‏ درجات 2 العيارية لها توزیع olds‏ 
النحنی الاعتدالي. لذلك فان درجات 2 العيارية ودرجات 2 الخطية للدرجات الخام تفسها 
تختلف إلى الحد الذي تبتعد فيه الدرجات الخام عن الاعتدالية.. 





ولتحویل الدرجأت الخام إلى درجات معيارية بأسلوب بسیط نحدد الرتبة الثينية الناظرة 
لكل درجة ala‏ بالطريقة التي ذكرت في الجزء السابق, ومن ثم النظر إلى Lays‏ 2 الرتبة 
المثينية وذلك باستخدام جدول درجات Z‏ العيارية القياسية. وكما تم في جدول )2-19( فإن 
درجات Z‏ الحددة لقیم درجات ala‏ متنوعة تتغير من عينة لأخرى اعتماداً على تباین العاينة 
في تکرارات درجة خام معينة. لذا فإنه یستخدم في دراسات العايرة واسعة النطاق أسلوب 
أكثر تعقید في تحدید الرتب الئينية ودرجات Z‏ العيارية. وهذا الأسلوب يستخدم عملية 
مطابقة للمنحنی تسمی تملیس ally SMOOTHING)‏ تتغیر بشکل ملحوظ. لذا فعلی 
القاری إن يمين إن العرض هنا هو فقط لتحدید الفهوم العام. 

افترض انه تم تمثيل الدرجات الخام على الحور الأفقي في التمثیل على الستوی البياني. 
وتمثیل الرتب المئينية الرتبطة بالدرجات الخام على الحور العمودي (کما في شکل11-9) 
ویکون النحنی الناتج عبارة عن رسم لنقاط متقطعة» ومع ذلك فمن المکن تثبیت منحنی بشکل 
S‏ لمجموعة النقاط هذه (انظر شكل 1-19 ب). فإن كان توزيع الدرجات الخام طبيعي تماما 
فإن النحنی الناتج يكون طبيعي (نوقش في الفصل 15( وهنالك أسلويين عامين يمكن | 
استخدامهما لتمثيل منحنى آملس لنحنی النقاط. احدهما هو رسم منحنى بالید باستخدام 
منحنی مثل المبين في شکل 19 -1 J‏ ومع ذلك فقد اقترح انفوف )1971 (Angoff,‏ استخدام 
ورقة الاحتمالات الطبيعية (normal probability paper)‏ وهي ورقة بيانية تبنی بحیث ترسم 
النقاط من التوزیع الطبيعي التي تقم على خط مستقیم واحد. والأسلوب الثاني پستخدم 
الطابقة مع دالة رياضية للتوزیع التكراري» وبناء توزيع تكراري تراکمي من الدالة الرياضية. 
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Raw Scores 
{2 دا‎ 16 $8 20 32 34 6 


)1( تمثيل بياني للدرجات الخام والتکرار الراكمي 





Cumulative Frequency 


150 
1125 


too 





75 


ae Row Scores 
t? $4 16 18 20 22 34 6 


(ب) منحنى أملس بالاعتماد على التمثيل البياني 
شكل(1-19) الازواج المرتية ومنحنى للعلاقة بين الدرجات 
الخام والتكرارات التراكمية لبيانات جدول 1-19 

وقد أوضح JS‏ من كيتس ولورد (Keats & Lord,1962)‏ ولورد ونوفيك )1968, (Lord & Novick‏ 

Galt‏ دالة قوق هتفش شالبة Vig)‏ الهنف: 
وحالا يتم رسم النحتی الأملس الذي يبين العلاقة بين القيم على تدريج الدرجة الخام 
والقيم على تدريج الرتبة الئينية» فإن الرتبة المئينية المناظرة لدرجة معينة تؤخذ عن المحور 
الرأسى وتعتمد بدلاً عن الرتبة المئينية الأصلية المحسوية من تكرارات البيانات اللاحظة, 
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وبالتالي فإن درجة 2 العيارية القياسية تحدد آیضا بایجاد درجة 2 من جدول النحنی 
الطبيعي التي تناظر درجة الرتبة الئينية اللساء. ويجب ملاحظة إن التملیس (SMOOTH-‏ 
ING)‏ عملية عامة في بناء التدریج ولیست محددة بالنحنیات التي تبين العلاقة بين الدرجات 
الخام والرتب الثينية ویمکن تطبیقها على تحویلات التدریج الختلفة 

إن قرار معايرة الدرجات القياسية في تطوير العاییر ليست واضحة بشکل قطمي. 
CERET‏ فإن هذا التطبيق wail‏ بشکل مناسب خاصة في تطوير مقاییس الاستعداد 
والتحصیل التتضرة تجاریا » ولثل هذه الاختبارات فإن هذه النقطة خاضعة للمناقشة OY‏ فى 
العدید من الأمظة فان التطبیقات في كتابة الفقرات وفي اختیارها تستخدم لانتاج اختبارات 
شريطة إن یکون توزیع مجتمع الفحوصین طبيعياًء وحجوم العینات كبيراً لدرجة كافية لیمثل 
توزیم المجتمع بدقة. وتصيح عملية العايرة أكثر أهمية وذلك Lasis‏ یبتعد توزیع الدرجات 
بصورة أساسية عن التوزیع الاعتدالي. وهذا شائع في آبحاث التدریج الصفيرة أو دراسات 
العايرة الحلية حینما یکون حجم عینات المعايرة صغير بشكل yale‏ وفي مثل هذه الحالات 
فان توزیع درجات Z‏ العيارية قد یختلف اختلافاً واضحاً عن توزیع الدرجات الخام الأصلية. 
وهنا يبرز سوال عما إذا كانت الدرجات الخام أو الدرجات العيارية هي التي تمثل توزيع 
الدرجات بشکل آکثر Gu‏ (أكثر ثقة) مما لو اختبر الجتمع الاصلي برمته. من جهة آخری 
یبدو إن بعض منظري القیاس يؤيدون آو یدافعون عن معايرة الدرجات Gly‏ لها مستویاتها. 
وذلك في حالة اعتقاد الباحث أن السمة النفسية المستهدفة تتوزع tacit‏ في الجتمع 
(Magnesson,1967)‏ وادبعی جوليكسن(6:!111562,1950) أنه من المنطق الاعتقاد بان القدرة 
القيسة بالاختبار تتوزع طبيعياً ولكن الانحرافات في الاختبار سببت انحراف الدرجات 
الملاحظة عن الاعتدالية. ومن جهة أخرى حذر انغوف )1971( من التحويل إلى التوزيع 
الاعتدالي الذي قد يكون غير مرغوب. خاصة إذا كان شكل التوزيع غير الاعتدالي دالة لعملية 
اختيار الفحوصین, أو اي توزيع غير مألوف للقدرة في المجموعة المعينة التي تم اختبارها. لذا 
فانه لام مقشند ذوعا ما القول نآن:معايرة الدرجات لها مستویاتها عتذما لا يكون Sl Sh‏ 
الدرجات متطرف جداً عن الطبيعي لنبد به ومن الصعب تخيل موقف يكون توزيع درجات 
العينة بعيد كثيراً عن التوزيع الطبيعيء وبالتالي فان الفاحص يقتنع بان العينة هي تمثيل 
مناسب لجتمم ما یکون توزیع السمة فیه جعي ٠.‏ 


تحويلات الدرجات الزائية: 
في كلا الحالتين الخطية. وغير الخطيةء فان الدرجات الزائية لها مساوئ من حيث استخدام 
قيم عشرية (كسور) أو سالبة أو Loads‏ والتي يصعب التعامل معها حسابیا وصعوية تفسيرها 














لستخدمي الاختبارات (افترض لوهلة مهمة محاولة التفسير لفحوص تقدم لاختبار من 300 
ملائمة إجراء تحويل خطي للدرجات الزائية لتحويلها إلى قيم أسهل تسجيلاً وتفسيراً. ومن 
اهم أن نتذكر (وكما لاحظنا في فصل 2) إن التحويلات الخطية لا تغير شكل توزيع الدرجات 
الزائية. والصيغة العامة لثل هذا التحويل هو. 

61 ا‎ (Z)k+m=y 

حيث ترمز Y‏ إلى الدرجة المحولة والقيم 10 و K‏ قيم ثابتة تختار اصطلاحاً من قبل مطور 
الاختبار والقيمة m‏ تمثل متوسط التوزيع الجديد بعد التهويلء والقيمة k‏ إلى الانحراف 
المعياري الجديد . 

ويمثل الشكل )2-19( عدة تحويلات شائعة لدرجات 2 تحت المتحنى الطبيعي. daly‏ من 
التحويلات هو الدرجات التائية التي طورها مكول )1939 (Me call,‏ والذي اقترحه لتدوين اداء 
الاطفال على اختبار القدرات العقلية والصيغة العامة للدرجات التائية هو: 

E e eee 50 + 10 (Z) =T 


: العام يأخذ الصيغة‎ GUSH لتدوین درجات القبول في‎ Teating Service) 

ES Meee eee 500 + 100 (Z) =y 

لذا فان متوسط توزیم الدرجات المحؤلة 500 وانحرافه العياري = 100 نقطة ومن ASÍ‏ 
التحویلات شهرة للدرجات الزائية جمیعها هو انهرافات LQ slays‏ والتي لها الصيغة 
العامة: 

(10-19)............... 100 + 15 (Z) = DIQ 
الدرجات الشتق هذا صمم لیکون متوسطه 100 نقطة وانحرافه العياري 5 نقطة. وتستخدم‎ 
اختبارات الذکاء الاخری مثل مقیاس ستانفورد - بینیه انحراف معياري 6 نقطة. وللدقة‎ 
اقترحه‎ . quotient intelligence التاريخية يجب ملاحظة ان الفهوم الاصلی لحاصل الذکاء‎ 
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ويليهم (Wilhelm,1982)‏ لاستخدامه في مقياس بینیه, وهی ليس درجات IQ‏ التي قدمها كابلان 
وساكوزو )1982 , (Kaplans & saccuzzo‏ الذين لهم الفضل lags‏ التطور التاریخی لاختبارات 
الذكاء. 
اخيراًء تدون بعض ادلة الاختبارات التحصيلية المقننة جداول لتحويل الدرجات الخام او 
. الرتپ المثينية الى مكافئات على النحنی الطبيعي (NCE)‏ والتي تكون مرتبطة بشکل uola‏ 
۱ بنموذج التقويم معياري المرجع )1976, (Tallmadge & wood‏ وهذا التدريج له متوسط )50( 
نقطة وانحراف معياري )21.06( نقطة وتستخدم الجداول العيارية في تحویل الرتب الميئنية 
الى تدريج مكافئات المنحنى الطبيعي (NCE)‏ والتي يتم الحصول علدنا يتحديد الدرجات 
الزائية العيازية القياسية الرتبطة بالرتب الثنية واجراء تحویل باستخدام الصيقة : 


ian, 50 + 6 (Z) = NCE 
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شكل (2-19) : الگنحنی لصحي المكينات, ودرجات معيارية منتقاة اعيد طباعتها من مفكرة خدمات 
الاختبار 148 لرابطة السیکولوجیین 














التدريج التساعي: 

دة re‏ الخو سين خاس EE TE E EESE‏ ريه 
مؤلف: من اقا مدا وإجدة راوح كين :1 الف وهذا التدروي پوش طريقة لوحتف اذا 
المفحوصين بشكل موسع. وتستخدم مثل هذه الدرجات في مدارس القاطعات ولإيصال نتائج 
aa‏ لزانم إن أن وب الع تو ع باسح وتا اليل اتسين اناد 
للفروقات الصغيرة التي تظهر احياناً عندما تدون الرتب المثنية وحدها. ووسط هذا التوزيع = 
5 نقاط واتحرافه العياري = نقطتين تقريباً. ونمونجياً في التوزيع الطبيعي فإن الدرجات 
plat‏ الناظرة لأوسط )920( من التوزیع col)‏ من الرتبة 40 الى 59( يشر لهم Taai‏ 
التساعي الاوسط )6 والدرجات الخام الناظرة للرتب النينية السبعة عشر التالية (اي من 
رتبة 60 الى 76( paths‏ لهم بالتساعي السادس, والدرجات الضام الناظرة للرتب المثيتية 
الاثنتى عشر a‏ یژشر لها بالتساعي السابع. والدرجات الخام الناظرة للرتب الميئنية 
السبعة التالية يؤشر لهم بالتساعي الثامن, والدرجات الخام الناظرة لاعلى أربعة رتب مثينية 

شر لها بالتساعي التاسع (انظر شكل 2-19) والطريقة نفسها تستخدم في النصف الاسفل 

P‏ للتأشير على التساعيات الرابع والثالث والثاني والاول على التوالي. 
الدرجات الرتبة في مستويات Scaled scores‏ 

معظم بطاریات الاختبارات التحصبلية تگرن مرتبة (منظمت) في مستویات بحید تزداد 
صعوية الستویات بارتفا ع مستوی الصف. ومع ذلك فان الستوی الوابحد من LIAM‏ یکون 
Sule‏ مناسباً لصفین او اکثر من الصسفوف التتالية. فعلی سبیل الفال: الستوی الواحد قد 
سكيديف اة من alae‏ ات SEN)‏ وخ كيار الضف ار إفتركن أن له الضف 
الثاني الذين درجاتهم على اختبار القراءة التحصيلي عند الرتية المثينية )50( مقارنة بمجموعة 
الصف الثانی العيارية. ورتبة الصف الثالث على الاختبار نفسه عند الرتبة الئينية (50) 
مقارنة بمجموعة الضف الثالث العيارية ومن الواضی أن فنتي الفحوصین لا یکون هم 
مي الت Ate‏ الق تسه كذلك فان alan‏ سای لصف تاره لا Seg‏ 
4خ ق هنو الاخعبارات كرح الامتمام. a‏ اترا ج بحت تدم as‏ نات 
معیاریة ضمن کل مجموعة ویسمح بالوقت نفسه للتوزیع بان بقع على تدریج موحد یعکس 
الستوی التريوي او التطوري الاعلی المجموعة الاکثر تقدماً (انظر شکل ۰)3-19 Shay‏ هذه 
الدرجات العيارية التي تعکس US‏ من مجموعة الرفاق والجموعات (الحالات) الطولية ترف 
على انها درجات مدرجة (مرتبة في مستویات (scaled scores‏ أو تدریج الستوی الصفي. 


إن بناء fio‏ هذا التدرج الذي يعكس ترتیب الستویات ظهر في النصف الاخیر من القرن 
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السایق. واحدی الطراتق البكرة هي طرق ثیرستون في التدریج امطلق وکما تطبق:علی 
اللشكلة:الحالية فان شرج فپرستون GULL‏ يعد .طريقة ای اسلوب اتحویل الدرجات الحا لكلا 
الجموعتین اللتین تقدمتا للاختبار نفسه» ومعروف انهما مختلفتان في الستوی التربوي او 
الحالة التطورية الى تدريج یکون توزیع درجات کل مجموعة فيه توزیع طبيعيء والدرجات على 
التدریج الجدید ستظهر كنا في الشکل (3-19). لاحظ أن الهدف الرئیسی لیس ببساطة وضم 
le al‏ على التدر تا مخت آن کلا eat‏ عدن وة تلاخد ار شنت كانه سيتم 











شرك ارات اوعدن ريصت gucilas‏ ا055 العملية Syst) TEN‏ سوس الفرجات 
المرتبة فى مستويات: 


توزيع المجموعة (ب) ٠‏ توزيع المجموعة (1) 








شکل(3-19) توزيعات الدرجات المعدارية للمجموعتین أ و ب على تدريج مشترك . 
1- تطبيق الاختبار على مجموعتين (أ و ب) شريطة ان يتداخل توزيع درجاتهم الخام . 
2- اختر درجات خام تتراوح من 10 الى 20 (:5) من منطقة التداخل . 
3- لكل قيمة (x;)‏ أحسب قيمتى Z clays‏ المعيارية الناظرة ل Zp;‏ و Zai‏ كل فى توزيعه. 
4- مثل بالرسم البياني ازواج الدرجات Zai‏ و م2 لكل قيم درجات Xj‏ الخام. بحيث تكون 
Zai‏ على المحور الرأسي و Zipp‏ على الحور الافقي. 
5- ان كان هذا الرسم البياني خطيء فان كلا المجموعتين يمكن معايرتها على تدريج 
وعلى افتراض ان التمثيل حقق متطلبات الخطية؛ سنبين الآن كيف يمكن تأسيس تدريج 
مشترك لهذه الدرجات وریطها بتوزيعات درجات كلا المجموعتين . 
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دعتا ترمز الى ee ce a aR‏ الى الوه 
بالتحويل الخطي: 
DAD) oleic sche Mya + Oya ZA =Y‏ 


وحيث ترمن Hya‏ و Oya‏ الى المتوسط والانحراف العياري لدرجات Y‏ للمجموعة A‏ 
والان يمكن ربط كل قيمة Yi‏ بتوزيع م2 بالعلاقة : 
OIE yb + Oyp (Zp) =Y‏ 
لذا فإن: 


(Zp) Oyb + yp = Zai) Oya + Hya 


+ AGH ih cle Zad كفا يكل الشبیر هذا‎ 
1 00 Hyb ~- Uya ۱ Oyb oy. 
(CEL) ee ۱ a + و سل و‎ 


¢ 0 
(انظر المعادلات 16 -12 و 16 -2ب)» ويجعل Hya- Hyb) = mM‏ ) | یروت و =k‏ 
ya‏ 


وتأشير القيم مناسبة لكل من Mya‏ و Oya‏ یمکننا بعدها ايجاد قيم Hyp‏ و Oyb‏ لمعادلات القاطع 
Sully‏ على التوالي. Ulag‏ نحصل على asd‏ كل من Hya‏ و Oya‏ و Hyb‏ و Oyb‏ یمکننا تحويل 
الدرجات الخام على اي من التوزیعین ۸ آو 8 إلى التدریج الشتراه -Y‏ ومع ان طريقة 
ثیرستون تسمح باختلاف كلا من التوسط والانحراف العياري لکلا التوزیعین» فقد Bay‏ 
جولیکس انه يبقى من الضروري افتراض ان كلا التوزیعین متشابهین في الشکل. 

وفي مشكلة التدریج الذکورة اعلاه المجه عتين العروف اختلاقهما في الستوی التربوي او 
الحالة التطورية التي تتقدم للمستوی |لاختباري نفسه. فإن هدف التحلیل هو تة Qua‏ توزیعات 
درجات المجموعتين على التدريج نفسه. مشكلة مشابهة ولكنها اكثر تعقيداً تكون عندما يقصد 
استخدام مستويين اثنين مع مجموعات مختلفة. ونرید التعبیر عن درجات الممستويين على 
التدريج نفسه. ومعايرة الدرجات للمجمومتین على التدريج. ثانية فان الهدف یکون في استخدام 
التوزیعات العيارية لاجراء مقارنات مغيارية ضمن المستوى واستخدام التدریج الشترك بحیث 
يكن مقارنة الاداء على الستویات الختلفة. ولحل هذه الشكلة يلرم اجراء خطوتین:- 


۱ 
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الوق نكب كنع الراك نين الو علن القدروع سروعس VIE (ace per‏ 
الرأسية التي ستناقش في الفصل التالي. 

ال تحویل الدرجات الناتجة عن العادلة الراسية بحیث يخ معايرة توزیم 
الدرجات الجدیدة لکلا للجموعتین» وهذه الخطوة یمکن تحققیها باستخدام طريقة التدریج 
الطلق التي بیناها سابقاً. 

وکهدف في تفسیر الدرجات الرتبة في مستویات في الاخنبارات المقننة, يجب على 
هی ان ةا انم الدرجات ارف فى مشكويات يقبي (Wide)‏ 
0م فعلى سبيل المثال في الاختبار الفرعي في القرامة في اختبارات الميترى بولتيان 
التحصيلية (1978 (Prescottetal,‏ کانت درجة المفحوص الذي رتبته الميئنية في الصف الثاني 
(50)» كانه درجته علی هذا التدریج (571) ومفحوص آخر فى الصف الخالث له اکان 
النسبي نفسه كانت درجته على هذا التدریج (644) وفي الوقع نفسه. ولفحوص في الضف 
الرابع كانت درجته على هذا التدریج )674( لذا فان الفحوص الذی يعمل من خلال التطور 
ارو الي شیم کر كل ا ا خر isl‏ سوه ومعصل على ترس :الى 
على هذا aad E area ah‏ ادا له )نی consi‏ تسه بالق کار شرت Real‏ ی 
او المستوى العمري .كذلك قد یتقدم مفحوصين اثنين لستویات مختلفة ویحصلون على الدرجة 
ا ع التدريم قينا لى اجان اخ فصو le‏ عون كيين Galley‏ ات السيلة 
IS‏ ی ye coal Gs‏ السيول وی الوقن نمه اعاب SN‏ عن عو آقل مق 
الفقراك اجابة مسمیجه: Sly‏ قهرم لاكتبان من س الور يديد ا عا ي 
مستويات في تحقيق هدفين هما: 

هفنا بشع cle‏ ا جو oe IG) Clase‏ الست مق اتف الال اقا ان 
أدنى فإن درجاتهم على هذا التدريج يمكن استخدامها في ريط آدائهم بدرجات ER‏ 
الثينية للمجموعة المعيارية او مستوى الصف الفعلي. 

2- في الابحاث ودراسات التقويم حيث يحدد متوسط slut‏ الجموعة. وذلك للمجموعات 
الى تا رن ییایح رکش قرو سای تسام 
التدریج في الوقت الذي يكون متوسط الدرجات الخام أو متوسط الرتب الميئنية 
مضللاً.ومن الهم تذکر ان مع اهمية الدرجات على هذا التدریج في مقارنة اداء 
eal‏ عن و ف Ma‏ كين poll‏ لرل GSN‏ غير فایلا لتقا 2 
مبوسوالات ارات ال ا کا تا ویک رش ناه 
pata al‏ تخلال همان هار الور التحصميلن إذ دسا هاي فى اضف 
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مه اها ٠‏ ام MNP,‏ ممم ممم ممم man ۰ minana aanne‏ 


الخال عل SGA ts aa‏ قلق SENG i alse‏ 
سل على وات على هذا eau‏ :)5925644( غل الو الى فى قف الو خب وهاه 
ادائهم في القراءة بالنسبة ني والفروق في درجات التدريج هنا تعكس الفروقات 
الصفي. وتحدیدآفان الجموعة العيارية الصف الثالث JSS‏ کان ادام‌ها افضل نوعاً ما 
في المادة المغطاة بإختبار القراءة اكثر مما هو في المادة ail‏ اختبار الرياضيات 
مكافتات الصف والعمر: l‏ 
عندما يختير ae‏ بمقاييس الاستعداد او التحصیل فان مستخدم الاختیار يحتاج all‏ 
درجات معيارية تة تشير الى كيفية آداء طفل مقارنة بأداء الاطفال الاخرين من عمر معين او 
مستوی صفي معين. وتستخدم ERS‏ لهذه المقارنات درجات المكافئات الصفية آو العمرية. 
ومع ذلك توجد محددأت شديدة لهذه الدرجات والتي تسبح واضحة حال وصف dalas‏ 
تطویرها: 
وقد وصفت — e DIN‏ العملية العامة هم on‏ مواسطتها ناشري 
اك تحویل توزیم درجات الاختبار لغام ules:‏ مرس ات تشن 
ف الم Ss aa‏ هن» الضلیه Baal‏ ریات موف ANG‏ 
2- تحديد وسیط درجة التدريج لكل مستوی صفي. وتمثل على مستوى SUS‏ المتغير, 
وی يشير المحور الافقى الى أ لصف والسنة و لشهر الذي أجريت فيه | لعملية الاختيارية 
ويشير الحور العمودي الى قيم الدرجات الرتبة في مستویات. ویکون وسیط التدریج 
للمستوی الصفي اعلی السنة والشهر للیوم الذي تم فيه معايرة الاختبار . 
3- رسم منحنی املس يوصل ما بين هذه النقاط كما هو مبین في الشکل (4-19) (بشكل 
توا شی کر الا متا (bara,‏ 
ae tes‏ برجة a el PEN‏ الى درجة التدريج ثم الى 
الستویات الصفية التي لم يطبق عليها الاختبار ويسمح 9 Pre men eg peer‏ 
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درجات الکافیء | لصف ي هي: 


The, 


حاكن الکافتات العسرية كدر عرضبة لخطاً التقسیر من فبل مستخدمي الاختبار اکش 
من الانواع الاخری من الدرجات العيارية. افترض على سبیل المثال أنه اختبر طالب 
في الصف الثاني في نهاية السنة وحصل على مکافیء صفي 6.۴ =5.3 في کل من 
الرياضيات والقراءة والعلوم والتفسير المناسب هو انه هذه الاختبارات ولحتوى الصف 
الثانى فإنه يتوقع تشابه أداء هذا الطالب مع آداء تلميذ عمره خمسة سنوات وثلاثة 
اشهر, وهذا لا يعني ان أداء هذا المفحوص سيكون بالطريقة نفسها على اختبار يغطي 
محتوی الصف الخامس, وذالك لآن هذا التلمی لم بتمرض للتدریس لتلك Gath‏ لذا 
فإن اسم هذه الدرجة يعطي انطبا g‏ خاطیء موّداه ان الطالب له قدرة على انجاز مهام 
اتف انا 





شکل(4-19): تمثيل بياني لقیم درجات ald‏ مختارة مستویات صفية متتالية في مواقف اختبارية ثلاثة 
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مقارنات درجات المستوى الصفي عبر مجالات عدة للمفحوص نفسه قد تكون مضللة 
انشا . على سبيل الثال مكافىء صفي )3.9( في القراءة و(3.9) في العلوم يبدو انها 
تشير لكفاءة متساوية في كلا الجالین» ولکن هذا ليس حقيقياً. مع ان الکافئات الصفية 
لكلا الموضوعين متساوية. الا ان الرتب المئينية في المجموعة المعيارية للمستوى الصفي 
للموضوعين قد تكون (68) في القراءة و(82) في العلوم . 











June 3‏ الشو علی تدزیج SUCH‏ الصفية خنمن مستوی صفی معین gl‏ مستوی همري 
| حسبت بوساطة عدد قلیل من التقاط الناظرة للفترات الزمنية التي طبقت فیها 
الاختبارات. والنحنی الواصل بين هذه النقاط پرسم Babe‏ بافتراض ان معدل التمو او 
الاد يكون متم دين مده الق اينه وی موص هذل الفا علی سيل 
المثال فان الافتراض للكميات نفسها من التطور من شهر لشهر خلال السنة الدراسية 
قد كون متعذر. MS‏ فيما لو حصل طالبین على درجات )3.8( و(3:9) على التؤالي: 
تلن من الخيريرة أن يكرح متخا امطاء فيز تعليمي اضافي اا الاول ان 
یجعل التلمیذین الاثنین بالستوی الوظيفي نفسه. j‏ 

4- للاختبار الواخد, والناسب للمفحوصين لدی او فثة محددة من الستویات الصفية 
(مثل من الثالث وحتی الخامس) تحول الدرجات الخام عند طرفي التوزیع الى تدریج 
المكافيء الصفي بالاعتماد على امتداد النحنی لجموعات الستوی الصفي والذین لم 
يتقدموا للاختبار Shad‏ فعلی سبیل الثال من المکن لطلبة الصف الخامس ان یتقدموا 
ghey‏ فى الدراسات الاجتماهية الممتتوى الضفي cati‏ والخصنول على درجة 
مكافيء صفي -1.0 » ومع ان اختبار الصف الخامس لم يطبق على الذين سيدخلون 
مستوی الضف الاول وتم الحصول علی امتدادات درجات الكافي» الصفي من خلال 
افتراض ان النحنی او LAN‏ الذي یصف العلاقة بين درجات الاختبار وللستوی 
الصفي يستمر في التنبق للصفوف التي لم تختبر هو افتراض معرض للمساءلة. لذا 
فإن استخدام درجات الکافی الصفي تکون اکثر عرضة للمساءلة على طرفي التوزیم. 
وقد طورت تدریجات المكافيء العمري بالطريقة العامة نفسها التي استخدمت في تطویر 
تدریجات الكافيء الصفي. ویجب تأسیس قرار محكي في تدریج الكافيء العمري 
وذلك لتعیین مفحوصین للمجموعات العمرية الخاصةء فلکل طفل عمره (سنتان آو اقل) 
يمكن ان تعطی فثات العمر على فترات من ثلاثة اشهر أو ستة آشهر, وقد تکون الفتات 
العمرية للاطفال الرضع بفترات اسبوعية آو شهرية. وللمفحوصین الاکبر فان الفترات 
السنوية تعد معیاراً مناسباً. ومن الشائع في تعيين الفحوصین الى الفترات السنوية 
تعیین الفحوصین الذين هم ضمن ستة اشهر تالية لتاریخ الولادة الى فة العمر الاعلی 
من فئتهم العمرية, ومن المکن ايضاً استخدام الفحوصین الذين هم ضمن ثلاثة او 
اريعة اشهر تالية لتاريخ الولادة وبتعیین الجموعة الاخيرة الى الفئة التالية الاکبر عمراً 
وهذا ينتج dic‏ خسارة افراد من الجموعة المعيارية Gall‏ العمرية . 
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ينتج Ge‏ أكي اخطاء معايذة, fills‏ 5 5 ار اد 8 : 
E‏ الخطاً pan‏ عن | العملية الأختبارية. ou dal‏ 


العا ae‏ وليل الاختبار p‏ لفاح تون ay:‏ 








لتفسيريا stool‏ الاختبار يجب تطوير رد من ال ai‏ 


E ber tae E‏ المعناييز والدزجات اعيا 
ee ORG Fare‏ 4 = رية 








لل RN Se‏ نوسي سا YS‏ لصي يوا o MARUI‏ اليد مف إل o e‏ دید الوه Sh ee‏ چ ی و تباید مد SA Neca Wade ante ene‏ 








3- الدرجات الزائية المعيارية : وهي القيم الزائية a‏ الجدول لزائي 
المعياري والمناظر لرتبة معينة. 

4- الدرجات المشتقة: وهي تحويلات خطية للدرجات الزائية Las)‏ فیها الدرچة 
التائية, ودرجة نسية الذكاء اطشتقة. ودرجات (NCE‏ 1 





E -9‏ ا و ی الدرجات الخام الى قسعة اجزاء بحیث 


6 = المرتبة في السجويات: دق درج ة الفحرس با hiig‏ 3 سب 


iy ری‎ D 
2 المكافقات الصفية والعمردة: وتق‌تبر مستوی القخوض جرا‎ -7 
الاختیار..‎ a عمري آو صفي معان‎ 








اتتمارین: 
او اس ع و كد افترض ان 
مستخدم الاختبار يرغب في تطوير معايير صفية محلية لهذا الاختبار» وحيث أن 
E‏ ا ا 
ie‏ العیاری للمتوسط ‏ 
ب- بإستخدام الصفوف على أنها الطبقات, اعد عينة طبقية تتالف من 20 مفحوص 
تست Hegel el ual tet‏ 
المتغير الطبقي. فهل توزيع هذا المتغير في العينة التي اعددتها يعكس توزيعها في 
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د- قارن وسط عينتك بوسط المجتمع الكلي. وهل دقة وسط عينتك يعكس ما يمكن 
التنبق به بإستخدام نظرية العاينة. 


المتوسطات الناتجة عن طرائق المعاينة الثلاثة. أي هذه الطرائق يبدى انها تؤدي الى 








* الطلبة غير العادين: 
2/ لكل من الطلبة abal‏ وصفت طريقة المعاينة اقرا كل وصفء ثم حدد نوع المعاينة 

الأحتمالية المستخدمة. 

أ استاذ ale‏ نفس ربط بين استبانة مختصرة تتعلق بعادات الطلبة الدراسيةء وذلك 
الصف. l‏ 

ب- مشرف على الخدمات الطلابية في الجامعة اختار عشوئياً خمس وحدات من 
مخیم. ومن نزلائها اختار عينة عشوائية تألفت من %60 من النزلاء الجدد و9640 
من الفئات الاخرى وذلك فى دراسة مسحية تتعلق بالادمان الكحولى. 

















الاخيرة من الرقم المبين في بطاقة التأمين الاجتماعي تظهر نفسها في جدول الارقام 
العشوائية 

3 متخصص في التريية الصحية صمم اختبار تألف من (30) فقرة لتقييم المعرفة في 

الحقائق الصحية الاساسية؛ ويريد هذا المختص معايرة الاختبار على عينة طلبة الصف 

التاسع في العلوم الصحية ويرغب في ان يتأكد بنسبة %95 بان وسط المجتمع يقع 

ضمن فترة نقطة واحدة أعلى أو أدنى من تقديرالعينة. ويرغب هذا أ لختص بإن يكون 


وسط للاختبار المؤلف من 30 فقرة (25) درجة تقريباً وبانحراف معياري )5( تقريبا 


ata‏ اقل سيول کول Gila Ste gall‏ البيتة فى call‏ انناف 





ب- مثل بيانياً النقاط التي تبين العلاقة بين الدرجات الخام والرتب المئينية المعيارية 
(بحيث تكون الدرجات الخام على الهور الافقي والرتب المئينية على المصور 
العمودي): آرسم المنحنى الاملس الاكثر توافقاً مع هذه البيانات . 

ج- الان وعلى المحاور نفسها مثل بيانياً النقاط التي تبين العلاقة بين الدرجات الخام 
والرتب الثينية الاصلية. ارسم المنحنى الاملس الاكثر توافقاً مع هذه البيانات. فسر 
الفروق في شکل كلا النحنین . 
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5 اقرا وصف کل من المواقف La‏ واجب عن الاستلة التي تلي کل منها والذي یتطلب 
p (98) Lc or w a‏ )53( ونلك في اختبار تحصيلي ihe‏ وعند 
أعادة الاختيار olay!‏ كل درجة بقيمة 2 درجة خام فاي المفحوصين كان كسية 

آکبر في الرتبة الئینیة؟ لماذا؟ 

ب- كان ترتيب جوي على التساعي الثاني في السنة السابقة وعلى التساعي الثالث في 
السنة المالية وذلك قي اختبان ال ٠ tel‏ الرياضي, بينما کان ترتيب لويس على 
لوو ا اوه المغيارية» لاذا؟ ٠‏ 

و- بعد اعادة الاختبار نفسه هبطت درجة لاري من الرتبة المئينية (49) الى الرتبة 
امئينية )45( بينما طت درچة چون من الرتبة الميثنية )89( الى رت RER‏ 
Soda‏ لمان!؟ 

د- في نهاية الصف الثالث كانت المكافئات الصفية لكل من لویس, ساندراء كيم على 
درجاتهم الخام؟ بين رتبهم المئينية؟ وبين درجاتهم المرتبة في مستويات؟ 


. 6/ على افتراض ان الجداول العيارية لاختبار تحصيلي مقان تعتمد تطبیق الاختبارات في 
الشهر التاسع لكل مستوى صفي. والقيم المبينة في الجدول ادناه هي درجات الوسيط 
المرتبة في مستويات ناتجة عن اختبار طلبة كل مستوى صفي: 














i‏ استخدم هذه البيانات في رسم منحنى يبين العلاقة بين المستوى الصفي والدرجات 
رده فى شبات لكل gle)‏ 

ب- اعرض التفسيرات الممكنة للفرق في شكل كلا النمتیین . 

ج من خلال النحنی» حدد قيم المكافيء الصفي المناظر تقريباً للدرجات الرتبة في 
مستويات لكل إختبار . 

د- لو تم اختبار مفحوصین من الشهر الثالث للفصول (۰1 ۰2 3) فبماذا تتنباً عن 
سيط TAU Sleuth‏ فى السات 

هب افترض أن درجات الصف السادس كانت آدنی بصف في العلوم. وطلبة الصف 
الثاني كانت درجاتهم اقل بصف بالمبحث نفسه. فهل هؤلاء التلاميذ يحتمل أنهم 
مشابهون في موقعهم للمجموعة الصفية المعيارية» وهل ان درجات إختلافهم 
متساوية في الجدية؟ 

و- من خلال العاییر السقية: هل الکافی الصفي الواحد دون الستوی الصفي 
متكافئ في جديته في القراءة كما في العلوم. 

7 باستخدام الدرجات الزائية العپارية الحسوية في السژال الرابع sel‏ جدول لتحویل 
الدرجات الضام في ذلك التوزیع الى الدرجات ALL‏ والی درجات نسبة الذكاء 
الانحرافية والی الدرجات على تدریج (ETS)‏ نفسه الدون لدرجات الاختبارات الفرعية 
في (SAT) si (GRE)‏ 
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الفصل العشرون 
معادلة درجات الاختبارات المختلفة 


في عديد من الواقف يقاس مفحوصين مختلفین بادوات (اختبارات ومقاييس مختلفة) 
رن آنها تقیس السمة نفسها. فمثلاً في برامج شهادات الاختصاص هنالك صیغ عدة 
للاختبار تبنی بحیث يتعاقب استخدامها لمرات عديدة خلال السنة الواحدة. فان كان توزیم 
الدرجات لهذه الصیغ لیس نفسه فمن الضروري تحدید الدرجات المتكافئة من الصیغ 
الاختبارية الختلفة, ویطلق على عملية تحدید ola pall‏ التكافثة للصيغ الختلفة اسم العادلة 
الأفقية ."Horizontal equating’‏ أيضاً تتکون بطارية الاختبارات التحصيلية من عدة 
مستویات كل مستوی يناسب طلبة مدی معين من الصفوف الدراسية. افترض أن أحد هذه 
الستویات في البطارية مناسب لطلبة الصف الأول من الرحلة الشانية (الأول التوسط) 
والستوی الثاني یناسب طلبة نهاية الرحلة التوسطةء وفي مثل هذه الاختبارات فان الطلبة 
الذین یتقدمون ببطء في الرحلة التوسطة aah‏ اختبار للستوی الثاني صعب جداً للقیاس ‏ 
الدقیق لهذه الفئة من الطلبة. والحل المکن لهذه الفئة هو تطبیق اختبار الستوی الأول. 
ولتفسیر آدائهم من الضروري تحدید ola pall‏ المتكافئة لهم في الستویین, ویطلق على هذه 
العملية اسم العادلة العمودية "Vertical equating’‏ وأخيراً افترض أن Gals‏ أجرى دراسة 
استنیط متغیراتها من ملاحظات العلمین وترتبط متغیراتها بدرجات اختبارات التحصیل 
العيارية. وإذا طبق الباحث بطاریات اختبار مختلفة في القاطعات الختلفة. فمن الضروري 
معادلة درجات الاختبارات المختلفةء ویعد هذا مثالاً على العادلة الأفقية للدرجات. 

ويمكن اعتبار عملية العادلة تأسیس أو اشتقاق درجات متكافئة من اختبارات مختلفة. 
فإذا عودلت درجات اختبارین X)‏ و۲ ) وتقدم مفحوص لاختبار (x)‏ فانه یمکننا تحدید الدرجة 
الكافثة لها على الاختبار -(y)‏ والدالة التي تربط بين درجات (X)‏ والدرجات المكافئة لها على 
اختبار (Y)‏ یمکن کتابتها على النحو الآتي: 

f(x) =y* 

ويمكن مقارنة درجة المفحوص الذي تقدم لاختبار (X)‏ بدرجة مفحوص آخر تقدم لاختبار 
لاء وذلك بتحويل درجات (x)‏ إلى تدريج (*1 ). ومشكلة المعادلة تكمن في تحديد (x) Wall‏ £ 
ويمكن تمثيل الدالة بمعادلة رياضية على نحو: 











) لاه‎ ( reese 1 a(x-c)+d=y 


أو يمكن تمثيلها بيانياً كما في الشکل(1-20), والنقطة على محور (Y)‏ الناظرة للدرجة 
على محور (X)‏ هي ( *1) والمكافئة للدرجة (X)‏ 





شکل (1-20): تمتیل بياني لمعادلة dest) cated lf‏ لدرحات 
اختبارین افتراضین كل منهما مؤلف من 20 فقرة. 

تعردف المعادلة: 
آلواجب توافرها لاعتبار الدرجات متكافتة. والتعریف الشائع والقبول للمعادلة هئ يمكن اعتبار 
درجتین آحدهما علی الاختبار (X)‏ والاخری على الاختبار (9) متكافتة إذا کات کل منهما تقیس 
الاساس لطرائق العادلة الخطية lly‏ والتي سیتم طرحها فى الجزء التالي. 
جمع البیانات اللازمة تلمعاد له: 

تا تس نا انسیا کحم لیات AN E‏ سولاك ناه بش 


— 603 = 
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سس 604 





يدم hie gogan‏ - وفي حالة معادلة صيغتي اختبار توزع المجموعة الكلية إلى مجموعتین 
ah pers‏ وتتفدم تا ا الاولی X ae‏ ژولة تم شيع 000 DEVA‏ 
إلى مجموعات مختلفة من المفحوصين بالإضافة لاختبار مشترك a‏ إليه جميع المفحوصين 
اختبار تتقدم كل مجموعة إلى أحد الاختبارين بالإضافة إلى الاختبار الشترك وليس 
بالضرورة في هذا التصميم توزيع الأفراد عشوائياً على المجموعتين. ويمثل الجدول(1-20) 


جدول (1-20): مخطط توضيحي للتصميمات الثلاثة لمعادلة الاختيارات. 





أ- أ: تشیر إلى أن الجموعة تقدمت للاختبار × ثم للاختبار ۷ . 

ب- ب: تشیر إلى أن الجموعة تقدمت للاختبار × ثم للاختبار الشترك 2. 
ee‏ و 
آننا سنعادل توا خرن وفي هذه ax ee RTE ORES‏ تتقدم کل 
منهما لاحدی الصيغتين. وتعتمد العادلة الخطية على الافتراض ol‏ الفروق في التو‌سطات 
والانحراف العياري وتوزیع 7 الصیفتین X‏ و Y‏ متساویة. 

وإن كان هذا صحيحاً فإنه يمكن تعريف الدرجات المتكافئة بتحديد أزواج من الدرجات كل 
منهما على احدی الصیختین ا ویکون لهما الدرجة الزائية نفسها. ولهذا تکون 


الدرجتین متکافئتین اذا کان: 

















ولهاتين الدرجتين الرتبة الثينية نفسهاء ومعادلة التحويل من درجات X‏ على ¥ هي: 





(LAOS a(x-c)+d = y* 

وتكون القيم في هذه المعادلة: 

12-0 as =a 
X 

ûy =‏ 2-0 ب 

2a 0 ا‎ 


وتمثل x‏ الدرجة على الصيغة الأولى yey‏ الدرجة على الصيغة المحولةء وتصبح الدرجة × 
على الاختبار الأول مكافئة للدرجة y*‏ على الاختبار الثاني. 

مثال: افترض أن المجموعة الأولى تقدمت للاختبار × وكان متوسطها = 50 وانحرافها 
العياري = 10 في cae‏ آن الجموعة الاخری تقدمت للاختبار[ كان متوسطها = 52 
وانحرافها العياري -11. بالتعویض بالعادلة )2-20( نحصل على : 


1.1 is | 
10 


50=c 

52-0 . لذا تصبح العادلة )20-1( على النحو الآتي: 

` 52+50 - 1.12 Y 

وعلى هذا فان الدرجة 45 على الاختبار × تكافئ الدرجة 46.5 على تدريج درجات اختبار 


وتعد المعادلة الخطية مناسبة فقط إذا كان توزيع درجات كل من × و ۷ تختلف فقط فى 
التوسط والانحراف المعياري. والطريقة الأخرى للمعادلة هي معادلة الرتب المئينية المتساوية 
والتي تحدد الدرجات التي لها الرتبة المئينية نفسها على توزيع درجات كلا الاختبارين. وسيتم 
توضيح هذا في أجزاء لاحقة. 
المعادلة الخطية للتصميم ب 

هذا يتقدم المفحوصين للصيغ الاختبارية المختلفة ولكن بترتيب مختلف. وذلك للاحتمالات 


005 


























الممكنة جميعها بحيث يتم تحديد الترتيب عشوائياً على المجموعات المختلفة. وفي Ula‏ معادلة 
صيغتي اختبار هنالك احتمالين اثنين فقط وتكون قيم كل من 2 و © و 4 على النحو الاتي: 


وك 22و + شرت 132-20 
)40,2 0 ۱ 
barbo 0‏ 3-20 
2 
-d‏ لحك 3-20 = 


وتمثل الأرقام الدليلية في هذه الصيغ إلى المجموعات الفرعية التي تم تشكيلها لتتقدم 
ويقدم الجدول )2-20( Licey‏ احصائیات دراسة افتراضية آجریت على مجموعتين وفقاً 


جدول (2-20): الاحصاء الوصقي معادلة افتراضية باستخدام التصمیم ب. 





0.90 = 24.01 + 25.00 25 
31.36 + 28.09 ۷ 


25 = 24.8 + 25.2 =e 











۳ عدا - 263 


وبالتعویض ثانية بالعادلة )1-20( نحصل علی: 
x) 0.90 = y*‏ - 25( + 26.3 


ولتحديد قيمة yr‏ المكافئة للدرجة x‏ = 30 نجد أن الدرجة المكافكة لها على تدريج 
y‏ =30.8. 


العاد له الخطية للتصميم ج 


يتقدم لكل اختبار بهذا لتصميم مجموعة مختلفة,ولیس بالضرورة تشکیل الجموعات 
عشوائياً, بالإضافة إلى اختبار مشترك يتقدم إليه الفحوصین جميعهم. لهذا عند معادلة 
درجات اختبارين يتقدم لكل اختبار مجموعة مختلفة بالإضافة إلى الاختبار المشترك. 
افترض أن 7 تمثل درجات الاختيار المشترك» وتقدمت الجموعة الأولى للاختبار X‏ 
والجموعة الثانية للاختبار1. ولوصف الافتراضات التي تبنی علیها العادلة الخطية من 
الضروري تحدید الجموعة الفرعية 1 وهي الجموعة التي تم اختیار الجموعة الفرعية 1 منها: 
الفرعیتین 1, 2 الجتمع الكلي. والافتراضات الي تبني Yale‏ العادلة الخطية می: 
والقاطع والخطاً العياري لانحدار ‏ على 2 للمجتمع بأكمله. 
والقاطع والخطأ العياري لانحدار لإ على 2 للمجتمع باکمله. 
وتکون هذه الافتراضات منطقية فیما لو تم تکوین مجموعتین عشوائياًء وان لم يكن توزیم 
الجموعتین عشوائياً فان الافتراضات لا یمکن الدفاع عنها (Angoff1971)‏ وقد بين انغوف أنه 
كلما كان Guill‏ بين الجموعتین على الاختبار 2 أكبر فان الالتزام بالافتراضات یکون آضعف. 


& +b? (œ-œ ) 
y2 22 Z 22 





14-20 ۲ 
رگ‎ + bzi (07 3 o3) 


== 607 












































۸ ۸ ۸ 
يرلا 4-0 ب‎ + Bye, (Mz - Uz) = 


=> 4-20 ly» + مسرت‎ (ùz 3 Mz) =d 


وترمز الأرقام الدليلية في هذه الصيغ إلى المجموعات الفرعية. وتحسب الإحصائيات 
الخالية من الأرقام الدليلية للمجموعة الكلية. 

وتمثل الرموز Dyz;‏ میرح انحدار x‏ على Z‏ في المجموعة الأولى وانحدار ۷ على 2 في 
الجموعة الثانية على التوالي. ويجب أن بلاحظ القارئ أن العادلة )4-20 ب) تستخدم العلاقة 
بين × و 2 للحصول على تقد تقدير لمتوسط درجات المجموعة الكلية, كذلك فا فان العادلة )4-20 >( 
تؤدي ي الى y Sias ee a‏ للمجموعة الكلية. A‏ المعادلة T T‏ 


جدول (3-20): احصايئات وصفية لمعادلة افتراضية باستخدام التصميم ج. 





وبالتعويض بالعادلة (4-20) نحصل على: 


608 














28.2 2 2 2 
107 = (48.2 - 29.3) 21.2 + 11.1 5 


(711.2 - 29.3) 20.9 + 7 


80,5 = (78.8 - 81.8 0.9 + 77.8 = cC 
81,48 = 12 (83.4 - 81.8( + 83,4 = 4 
,ل بالعادلة )1-20( نحصل على:‎ © a ويتعويض قيم‎ 


"ل -1,1 x)‏ - 80.5) + 81,5 , وتستخدم في تحديد درجة y‏ المكافئة للدرجة على 
xX Last‏ ۱ 


معادلة المكينات المتساوية : Equipercentile Equating‏ 

ذكرنا في السابق أنه يلزم لمعادلة المئينات المتساوية تحديد الدرجة التي لها الرتبة الئينية 
نفسها على الاختبارين» مع العلم أن طريقة المعادلة للتصميمين (آبب) هي نفسهاء وسيتم 
شرحها على التوالي. بينما الطريقة الستخدمة للمعادلة للتصميم (ج) معقدة ولن نعرضها 
هناء ومن يرغب في ذلك عليه الرجوع إلى انقوف (011,1971عصة). 

الخطوة الأولى في المعادلة هي تحديد الرتب المئينية لتوزيع الدرجات على كلا الاختبارين 
(فی specail‏ قطبق سيف الاشتبان على الجموعتین). Guy‏ جدول )20 -4) الوتب 
الثينية القابلة للدرجات على صيغتي اختبار افتراضيء وبعدها تمثیل بياني لهذه الرتب مقابل 
الدرجات الخام على كلا الصیغتین. ومثل هذه النحنیات موضح في الشکل )20 ~2( لاختبار 
افتراضي مؤلف من (20) فقرة. وفي هذا الشکل يرسم خط يقطع كلا النحنیین عند الرتبة 
المثينية نفسهاء وبالطبع نرسم منحنی آملس يدوياً لتوزيع الدرجات التي حسبت لها الرتب 
المئينيةء وهکذا يتم الحصول على الدرجات المتكافئة على النحنی. ویوضح الشکل )20 -2) 
هذه الاجراءات للدرجة )12( على الاختبار (x)‏ والدرجة القابلة لها على الاختبار (y)‏ ویمثل 
الجدول (20- 5) الرتب الشينية. ودرجات (x)‏ ودرجات (*) الناظرة Lgl‏ والحسوية 
باستخدام النحنی في الشکل )2-20( 


== 609 
































شكل (2-20): تمتیل بساني للرتب المقينية 
المتكافئة لصيغتي اختبار. افتراضيين ویتألف 
كل منهما من (20) فقرة. 








جدول (4-20): الرتب المئنية على صيغتي 
اخننار. 
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جدول (5-20): الدرجات المئينية المتكافكة 





وبعد تحديد کل من «, y*‏ تمثل بيانياً ويمنحنى أملس عبر الدرجات» ويمكن رسم منجنی 
مثل المنحنى في الشكل )20-1( یدویا أو بطريقة تحليلية باستخدام الطريقة التي عرضها 
كوئين )1984 (Kolen,‏ ويعدها تقراً الدرجات المتكافئة عن النحنی» وفى مثالنا تكون درجات Y*‏ 
تقريباً كما في جدول (5-20): لهذا فلن نعرض جدول آخر للدرجات التكافتة. 


== 1 




















ولبيان جدول الدرجات المتكافئةء يمكننا تحويل درجات *لا إلى درجات ۷ كما هو موضح 
في الجدول (6-20): وكمثال لتفسير هذا الجدول: حصل فرد على الدرجة )13( في اختبارلا 
تكون درجته على اختبار x‏ = 14ء والرتبة الثينية لكل منهما تساوي 75. 


جدول (6-20): الرتب المكينية المتكافئة على صيغتي اختبار افتراضيين یتالف كل منهما من )20( فقرة. 
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الاختيار عبر طرائق العادلة: 

BM says‏ محکات لاختیار طريقة العادلة: الافتراضات ودرجة التقید Ags‏ والتطبيق: 
نله sans‏ کات تطيق على کل من اختار المانله الخطية Aska oh‏ الرفي القينية 
لتصمیم معين وللاختیار عبرالتصمیمات. 

Ae Be‏ الاختيار في العادلة الخطية والرتب الثینية: الناقشة TEV‏ تطبق على 
التصمیمات BIG‏ تتضمن معادلة الرتب الئينية عدد من الافتراضات اقل من افتراضات 
العادلة الخطية: 3f‏ أن العادلة الخطية تفترض أن الفرق بين توزيعي × و Y‏ في التوسط 
والتباين فقط. واستخدام عدد أقل من الافتراضات يعد آمر مهم. ومع ذلك فان الرتب المثينية 
تتطلب عددا من الرسوم البيانية. وإجراؤها یکون AST‏ تعقيداً من العادلة الخطية, لذا فاٍنها 
عملية لدرجة آقل. 

ونانياً: يكون خطأ العادلة النظري آکبر بکثیر من العادلة الخطية (00۳,1982. لهذا فانه 
یفضل استخدام العادلة الخطية فیما لو كان توزیع الدرجات الزائية لكل من × و ۷ لا يختلف 
كثيراً. 

EE E EROE E E aa 
تداخل بسيط أو معدوم بين الاختبارین» وهذا مستحيل من الناحية العملية. لذلك فان التصميم‎ 
استخدام ضيغ اختبارية عديدة‎ she (ج) یفضل من الناحية العملية. ویظهر موقف مثل هذا‎ 
لاختبار ما خلال العام الدراسي, كذلك فان قضية عدم تسرب الأسئلة تتطلب إجراء دراسة‎ 
معادلة الصيغ الاختبارية بمعادلة مستقلة.‎ 

كذلك فإن التصميم ( ج) يعد عملياً بدرجة أكبر في مواقف کهذه, فطريقة المعادلة تعتمد 
علی الافتراضات الخاصة بالتصمیمات )1 و ب) atal‏ إلى افتراضات آخری خاصة. say‏ 
انغوف (Angoff,1971)‏ من عدم التطایق لکلا العادلتین الخطية والئينية فيما لو كان توزیم 
درجات الاختبار الشتركت لکلا الجموعتین الفرعیتین مختلف بشکل واضی. وقد وصفت طريقة 
بديلة ثل هذا الوقف. اضافة إلى إمكانية تطبیق الطرائق التي تعتمد نظرية السمة الكامنة. 
ولکن استخدام منهجية انغوف أو تلك التي تعتمد نظرية السمة الکامنة تتطلب افتراضات 
آخری بالاضافة إلى الافتراضات التي تتطلبها تصمیمات (آو ب). وستطرح منهجية نظرية 
السمة الكامنة في المعادلة هذا الفصل لاحقاً. 

وعندما یکون بناء اختبارين بتداخل زمني قليل ممكناً يمكننا استخدام التصميمات الثلاثة 
في العادلة» وفي موقف كهذا يمكن توزيع المجموعة عشوائياً عند استخدام التصميم (T)‏ 
وهذا افتراض عرض نا . وعند الاختیار عبر التصمیمات الثلاثة يجب أن يؤخذ بعبن 


= 3 












































الاعتبار كلاً من قضيتي الدقة والتطبيق ليكون الاختيار منطقياً. ولتوضيح ذلك وازن بين 
التصميمين (أ و ب). ففي التصميم (أ) يتقدم الفحوص لإحدى الصیفتین» في حين يتقدم 
لكليهما في التصميم (ب) لذا فإن التصميم (أ) يتطلب وقت أقل لكلا مفحوص, ويعد هذا 
Ibe‏ من القضية فقط.والخطأ المعياري لكل التصميمين على النحو الآتي: 


2 
620) Gace: a 22+ 2( = SEy* 
ory )1- 0 ۸ 
)6-20( ی‎ erhan [Z2, (1 +Pxy) + 2] = SEy* 


وتمثلا۸ في هاتين المعادلتين إلى عدد المفحوصين الكلي و »7 إلى الدرجات الزائية لدرجة 

x‏ الحولة على *. وبالقارنة بين المعاذلتين )5-20( و )6-20( پبدو آنه إذا كانت N‏ هی نفسها 

فى US‏ التصمیمین فان الخطا العياري للتصمیم ب آقل, كذلك Ld‏ یکون اقل Leste‏ تکون 
بيرم آکبر. والتسبة بين عدد الفحوصین تتطلب الحصول على دقة متساوية. 

2 (Z2x +2) EN 


(1-Pyy) [Z2x (1+ pzy) + 2] NB 


على سبیل المثال: افترض أن Pyy‏ = 0.8 وللحصول على الدقة نفسها لدرجة × التي قيمة 
2 )20 +2( 10 


tg Fa cant es NA‏ مرس 
NB‏ )1 - 608 20 )1 + 0.8( + 2] 1 


وهذا يعني أنه يتطلب منا عشرة أضعاف العدد من المفحوصين للتصميم )3( لذا فإن 
التصميم (1) يكون عملياً فيما لو توافر عدد كبير من المفحوصين والاختبارين طويلين لكل 
مجموعة مفحوصين: بينما يكون التصميم (ب) عملياً إذا كان عدد المفصوصين اقل 
والاختبارات قصيرة لدرجة كافية لتطبيقها على المفحوصين في كلا المجوعتين. 
المشترك وكلا الصيغتين كلما كانت النتائج أكثر دقة في التصميم (ج) من تلك الناتجة عن 
من الفقرات المشتركة المثبت تجریبیا هو )20( فقرة أو )%20( من عدد فقرات أي من 














الاختبارين (Angof®1971)‏ لذا فان الاختبار المشترك یحتاج إلى وقت اختباري اضافي. 
وصيغة حساب الخطأ المعياري للتصميم (ج) هي نفسها المستخدمة للتصميم (ب). لذا فان 
استخدام الاختبار المشترك يزيد من درجة الدقة. وعند المقارنة بين التصميمين (ب و ج) فإن 
التصميم (ب) يتطلب وقت اختباري أطول من التصميم (ج) ولكل مفحوص. وعموماً فعندما 
يكون الارتباط بين الاختبارين آکبر من الارتباط بين الاختبار المشترك مع كلا الصيغتين فان 
المعادلة باستخدام التصميم (ب) تكون أكثر دقة من استخدام التصميم ج. 
المعادلة باستخدام نظرية السمة الكامنة: 

كما أشرنا مسبقاً فإنه يمكن استخدام نظرية السمة الكامنة في معادلة الدرجات 
وياستخدام التصميمات الثلاث. وتكون أكثر فائدة على الأغلب مع لتصميم (ج) عندما لا 
يكون توزيع الدرجات عشوائي. وهنا فإنه ليس من الضروري توافر الافتراضات اللازمة لكل 
من المعادلة الخطية والمئينية. وسنفترض في هذا الجزء أن المعادلة ستجري باستخدام 
التصميم (ج) ودون التعيين العشوائي لكلا المجموعتين. كذلك فإنه ليس من الضروري 
استخدام نظرية السمة الكامنة عندما يكون التوزيع عشوائي لتصميم (ج) وللتصميمين (أ و 
ب)» قفي هذه الحالات تعد المعادلة الخطية والمئينية ملائمة. 

ويتوافر حالياً العديد من نماذج السمة الكامنةء والنموذج الأكثر شيوعاً هو نموذج راش 
اللوغاريتمي أحادي المعلم, والنموذج اللوغاريتمي ثلاثي العلم. ويمكن إجراء المعادلة 
باستخدام أي منهماء بالإضافة لاستخدام النموذجين اللوغاريتمي SUS‏ المعلم واللوغاريتمي 
الطبيعي. ولتسهيل العرض قد اعتمدنا النموذج اللوغارتيمي أحادي البُعد (العلم) ومع هذا 
التيسيط فان العرض ليس LG‏ ولتفاصيل أكثر يمكن العودة إلى )1979 (Wright&stone,‏ و 
(Lord,1980)‏ الذي يبحث موضوع المعادلة باستخدام النموذج اللوغارتيمي ثلاثي العلم. 
مدخل مختصر لنظرية السمة الکامندة: 

للقارئ الذي لم alles‏ على الفصل الخامس عشر نقدم عرضاً موجزاً لنظرية السمة الكامنة 
هنا. تفترض هذه النظرية أن سمة كامنة واحدة تفسر العلاقة بين الأداء (الاستجابات) على 
الفقرات جمیعها. وهذا النموذح يبين العلاقة بين الدرجات على الفقرة ودرجة توافر السمة 
الكامنة. والنموذج اللوغاريتمي آحادي البُعد أو كما يُعرف بنموذج راش ينص على أن نسبة 


== 5 
































المفحوصين الذين أجابوا إجابة صحيحة على عدد من الفقرات 8 هي [(0)ج0] يرتبط بالدرجة 
على السمة الكامنة كما تمثله المعادلة: 
e (8 - bg)‏ 


ti 9‏ و و 
د ©-be)‏ ع +1 


ويبين الشكل(3-20) تمثیلاً بيانياً للعلاقة بين سمة كامنة افتراضية لثلاثة فقرات تختلف 
في قيمة Pg‏ ويطلق على هذه النحنیات اسم المنحنى المیز للفقرة (ICC)‏ ويمثل العامل by‏ 
معامل صعوية الفقرة. مع ملاحظة أنه ليس معامل الصعوية نفسه في النظرية التقليدية. 
وسيجيب 9650 من المفحوصين الذين حصلوا على درجة سمة كامنة bg‏ على الفقرات Bin‏ 
إجابة صحيحة. فمثلاً إذا كانت by‏ =1 فإن %50 من المفحوصين الذين درجة سمتهم الكامنة 
=1 سيجيبون على الفقرات ع إجابة صحيح. ويتبين من شكل )3-20( أن قيمة bg‏ للمنحنى 
المميز للفقرة الأولى هو الأقلء إذ تصل قيمته إلى 5.0 قبل المنحنيين الآخرين. لاحظ ويالعودة 
إلى المعادلة )10-20( أنه إذا كان هنالك فقرتين لهما معامل الصعوية نفسه فإن النحنی المميز 
Lag!‏ يجب أن يكون نفسه؛ وهذا صحیح لأن المنحنى المميز للفقرة saias‏ فقط على 0 وعلى 
درجة السمة الكامنة Dy‏ ومن هنا فان الفقرات تختلف فقط في درجة صعوبتها» ويفترض أنها 
جميعاً متساوية في القوة التمييزيةء وباختصار نقول أن هذا يكافئ الافتراض بأن ارتياط 
الفقرة Ge Se‏ المكرتية هی کر الراك ها 


نسية الذین 
اجابو! أجابة 
صسحيهة 





جات دي المح ناتسا تا وز 


2 1 0 ات و س 
القدرة الكامنة (8) 


شكل (3-20): المنحنى المیز لثلاث فقرات 
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Scaling latent Trait Scores تدريج درجات السمة الکامنة:‎ 


في العديد من القياسات الفيزيائية مثل الطول والوزن تمثل نقطة الصفر في التدريج غياب 
السمة القيسة. ونتيجة لذلك فإن إعطاء درجة الصفر للشيء لا يعد تمثيلاً مناسباً. فالدرجة 
صفر تعطى فقط للأشياء التى لا تمتلك شياً من الخاصية المقيسة. وفى نظرية السمة الكامنة 
لامكل اسه هياب لس ee‏ هذا فان الصفر يمكن استخدامه مع أي مجموعة من 
اللفحوصين المتجانسين في السمة الكامنة وعندما تشير إلى أن درجة المفحوصين تساوي 
فيفر galls:‏ هروا عد ال بات الک :ومن اعطاء اه الق کون شیر 
كامنة بدرجة أكبر درجات أكبر من صفر وهكذا . 

وطريقة آخری لتحديد نقطة الصفر هي أن إعطاء أي تدريج 8 لدرجات السمة الکامنة: 
يمكننا من تحويل 9 إلى “0ء وتحويل *0 m=‏ + 8 وتشير قيم m‏ المختلفة إلى نقطة الصفر 
لمجموعات المفحوصين الختلفة. لاحظ أن القيمة العددية ل ع هي قيمة على تدريج السمة 
الکامنة, فعندما يتم تحويل 0 على*0 فإن bg‏ تحول إلى *وط وتساوي byt m‏ 

وتوجد طريقة شائعة لتحديد نقطة صفر مناسبة. وهي تعيين تدريج بحيث يكون معدل 
درجة السمة الكامئة لجموعة آو مجتمع معين تساوي صفر. دعنا نری مطابقة هذه الطريقة 
في تحدید نقطة الصفر, افترض أنه تم تطبیق مجموعة فقرات على مجموعتین من الفحوصیین. 
وحیث أن نقطة الصفر مناسبة فهي تعطی لكل مجموعة بصورة منفصلة. ویتساوق هذا مع 
اختیار التدریج Oy‏ للمجموعة الاولی. وبهذا یکون متوسط السمة عندها = صفرء ویاختیار 02 
على آنها تدریج للمجموعة الثانية فإن متوسط السمة الكامنة على التدریج الجدید = صفر. 
وحیث أن كلا التدریجین یقیس السسمة الکامنة نفسها فان التدریجین پرتبطان بالعلاقة 
Cue ۰02+ 10 = 0[‏ أن 01 هي تدریسج الجموعة الأولى و 02 هي تدریج الجموعة الثانية. 
وتعني هذه العادلة أنه لتحویل الدرجات من تدریج الجموعة الثانية إلى درجة على تدریج 
الجموعة الأولی فمن الضروري |ضافة نط إلى الدرجة الحولة. 

افترض أنه من المکن تحدید مفحوصین اثنين واحد من کل مجموعة ویمتلکون الكمية 
نفسها من السمة الكامنة آو القدرة الكامنةء وبما أن 0 هي درجة الفحوص في الجموعة 
الأولى و 02 هي days‏ الفحوص من الجموعة الثانية. وکل منهما یمثل الكمية نفسها من 
القدرة ولکنها ممثلتان على تدریجین مختلفین, لذا فان m‏ = روط bgy-‏ وبالحصول على قيمة 
m‏ فانه يمكن تحویل أي days‏ على تدریج 02 إلى درجة على تدریج 0 باستخدام العادلة: 


m + 0 _ 8; 


وعند استخدام التصميم (ج) فان مجموعة فقرات (الاختبار المشترك) تعطى لكلا 
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الجموعتین. ولأي من هذه الفقرا ت فان m‏ = روط -bgi-‏ . ودستمر استخدام m‏ في تحويل 
درجة من تدريج z‏ الحموعة الثانية إلى درجة على تدريج م المجموعة الأولى. ويمكن BS‏ تقدیر 
قيم كل من روا و روط عملياً وكنتيجة فإن (Dyy-bgp)‏ ليست القيمة نفسها لكل فقرة في 
الاختيار الشترك. ويؤخذ عادة معدل هذه cal‏ فاك الل على خی اه و وستعرضص 
تفصيلات أكثر تحت العنوان التالي 'طبيعة الاختبار المشترك". 


طبیعة الا خنبار اللشترك 


یتطلب التصمیم (ج) استخدام اختبار مشترك لصیغ الاختبارات الراد معادلتها. وفي 
حالة استخدام نظرية السمة الكامنة مع البیانات الجمعة للتصمیم (g)‏ فمن الضروري أن 
تقیس فقرات الصیفتین وکذلك الاختبار الشترك السمة نفسهاء فى حين أن هذا الشرط لیس 
ضرورياً في العادلة الخطية والمعادلة الثينية للبياتات المستخدمة مع التصميم © 

ولأن الفقرات جميعها تطبق على مجموعة يما فيها فقرات الاختبار المشترك وتقيس السمة 

الكامنة نفسها فمن الممكن استخدام استجابات الفقرات جميعها للحصول على درجة 
الفحوص في الاختبار. وهذا ما سنعتمده في وصف معادلة الدرجات باستخدام نظرية السمة 
الكامنة. ومع ذلك فإن بعض الشركات التجارية تستخدم الاختبار المشترك لأغراض المعادلة 
فقط آي أن درجات الاختبار المشترك لا تؤثر على درجة الفحوص. 

خطوات المعادلة: 

أن الطريقة الأبسط لوصف طريقة المعادلة هي عرض الخطوات ثم تفسيرها: 

1/ قدر قيم by‏ للفقرات جميعها بما فيها الاختبار الشترك باستخدام بيانات المجموعة 
الأولى. هذه الخطوة تم تعديلها بناءً على افتراض أن الفقرات جميعها بما فيها فقرات 
الاختبار المشترك تقيس السمة الكامنة نفسهاء وعند إجراء التقدير يتم تدريج هذه 
التقديرات ننک نكون متوسظ چا السمة الكامتة = مقن ويبين dads‏ )7-20( 
تقديرات قيم bg‏ لخمس عشر فقرة أخذت للمجموعة الأولى والفقرات الخمس الأخيرة 
هي فقرات الاختبار المشترك (ويستخدم برنامج بيكال BICAL‏ الذي آعده رايت 
وزملاژه (Wright&Mead& Bell,1979)‏ في حساب هذه التقديرات: حيث يتم تحليل 
البیانات للمجموعتین بصورة منفصلة. وغلاوة على اختیار متوسط ذرحة السمة الكامنة 
مساویاً لصفر فإن برنامج بیکال یختار التدریج بحیث یضع متوسط درجات السمة 
الکامنة المعينة لكل درجة مصححة تساوي صفر. ولا تغير هذه الطريقة بأي حال من 
الأحوال بشکل هام التعدیل الستخدم لتقدیر 10 عن طریق الفروقات بين قيم Dg‏ 
للاختبار الشترك). 

















2 باستخدام بيانات المجموعة الثانية در قيم الفقرات جميعها بما فيها فقرات الاختبار 
المشترك. ويتم تدريج الفقرات هنا باعتبار متوسط درجة السمة الكامنة = صفر, ويبين 
جدول )7-20( قيم Dy‏ لخمس عشر فقرة الخمس الأولى منها هي فقرات الاختبار 
المشترك. l‏ 

3 احسب روط - روط لفقرات الاختبار المشترك الخمس ويعدها احسب قيمة M‏ بحساب 
معدل هذه الفروقات. وفي الجدول (7-20) تبيان لقيم يوط - روط لفقرات الاختبار 
المشترك جميعها في العمود الثالث» ومتوسط هذه القيم m‏ = 0.60. 

4/ قدر درجة السمة الكامنة المقابلة لكل درجة ولكل مجموعةء ويبين جدول )20 - 8) هذه 
التقديرات» وهذا آیضا باستخدام برنامج بيكال الذي يحسب صعوية الفقرة ویحول 
الدرجات الخام إلى درجات السمة الكامنة لكلا المجموعتين. وعلى القارئ أن ينتبه إلى 
أن درجات السمة الكامنة لكلا المجموعتين تعتمد على تدريج يختلف عن الأخر. 


5/ أضف قيمة M‏ إلى درجات السمة الكامنة للمجموعة الثانية لتحويلها إلى درجات على 
تدريج المجموعة الاولی» فمثلاً الدرجة الخام (1) في المجموعة الثانية لها درجة سمة 
كامنة (- 2.72) كما يبين هذا جدول (20 -8). ولتحو يل هذه الدرجة إلى التدريج 
الستخدم مع المجموعة الأولى أضف (0.60) إلى (-2.72) ونحصل على (-2,12). 
ويبين الجدول )9-20( الدرجات المحرلة جميعها إضافة إلى درجات المجموعة الاولى 
الاصلية. وکلا من درجات السمة الكامنة على التدريج نفسه. معادلة طبعاً. 
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جدول )7-20( تقدير صعوية الفقرات للمجموعة الژولی والثانية : 








وو يدوي Ty‏ اس ساي دی ا ای سلریاو اسمن 











جدول (8-20): هدول تحويل الدرجات الخام الى درجات السمة الكامنة 





== 1 ————— 
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معادلة الدرجات الحقيقية : 

حدد لورد(1980, Lord‏ طريقة للمعادلة باستخدام نظرية السمة الكامنة تعرف ب " معادلة 
المطروح فى الجزء السابقء ويلزم لعادلة الدرجات الحقيقية تحديد الدرجات الحقيقية المتكافئة 
على صيغتي الاختبار. والدالة التي تريط الدرجات الحقيقية تستخدم فيما بعد لمعادلة 


الدرجات الملاحظة. وتبين المعادلة (10-20) العلاقة بين درجات السمة الكامنة والدرجات 
الحقيقية: 
6 
PO) SF‏ .> ................)10-20( 
g=1‏ 


وتشير هذه المعادلة الي انه ولأي قيمة 0 يمكن تحديد الدرجة الحقيقية القابلة لهاء وذلك 
بحساب )8( Pg‏ لعدد من الفقرات G=‏ في الاختیار» ویجمع جميع الحدود» وعلى سبيل المثال 
الدرجة الحقيقية 1 المقابلة ل 0 1:5 هى: 


15 
01 120 > PALS 
g=1 
وتذكر أن:‎ 
)12-20( كن‎ a = P,(1.5) 
aoe: Gap “P0 


وبتعویض تقديرات bg‏ من جدول )7-20( نحصل علی: 


e(1.5-b1) 1.5)ى‎ - bis) 
11.9 = Tee GS DY Fe + Tye ds bis) =F 
15م‎ - 1.867) e@(1.5-0.444) 
1 1.9 = 1+ ع‎ 05136 a aE AS + Tre 50444) = 
.11.9 يقابلها درجة حقيقية قيمتها‎ (1.5) x ومنها فإن درجة السمة الكامنة على الصيغة‎ 


Cragg‏ الشكل (4-20) منحنی العلاقة بين Ty‏ » 0 وكذلك بين Ty‏ 20 وکل Lagia‏ يطلق عليه 
المنحنى المميز للاختبار. ويمكن اعتبار درجتين حقيقيتين (احداهما على الصيغة × والاخرى 
على الصيغة (y‏ متكافئتين اذا كانتا مقابلتين لدرجة السمة الكامنة نفسها ويبين الخط 




















التقطع فى الشكل )4-20( الدرجات الحقيقية المقابلة ل 0 = ۰1.5 ويبين الشكل )5-20( تمثيلاً 
بيانياً للدرجات الحقيقية المتكافئه على كلا الاختبارين. 

واذا كان ممكنا قياس مفحوص على الصيفة x‏ والحصول على درجته الحقيقية فيمكننا 
باستخدام منحنى الدرجة الحقيقية المكافئة تحديد درجته الحقيقية على الصيغة ۷ ۰ مع اننا 
لم نجري له قياساً على الصيغة [Sage Y‏ فإن منحنى الدرجات الحقيقية التكافثة يمثل 
معادلة للدرجات الحقيقية. وتكمن المشكلة الحقيقية بعدم امكانية الحصول على الدرجة 
الحقيقية على الاختبار x‏ واقترح لورد استخدام منحنى الدرجات الحقيقية المتكافئة بتعويض 
الدرجات الخام بدلاً من الدرجات الحقيقية (واقتراح اخر بديل من قبل لورد هو استخدام 
نظرية السمة الكامنة في تقدير الدرجة الحقيقية وبعد ذلك تعويضها بالدرجات الحقيقية 
الفعلية) وعندئذ تستخدم الدرجات الحقيقية المتكافئة على انها دالة cy? = f (x)‏ والتي 
بوساطتها تحول الدرجة × الى الدرجة الكافئة على تدريج الصيغة y‏ 





السمة الكامنة (8) 


شکل(4-20): العلاقة بين الدرجات السمة الكامنة والدرجات الحقيقية على مستوبي الاختبار 


المعادلة العمودیة: 
A eae‏ اه ae a ile‏ “ادبن شاه لیس ات تشد 
استخدام العادلة العمودية واللازم لتوحید .اختبارات مستویات مختلفة. وقد آشرنا الى أنه فى 
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حالة بطارية الاختبارات التضمنة مستويات عديدة تناسب صفوف مختلفة قد يكون مفيداً 
لبعض الطلبة اختبارهم باختبارات تناسب صفوف تختلف في مستواها عن صفه الفعلي, 
فعلى سبيل المثال الطالب المتفوق جداً في نهاية الصف الثالث يمكن اختباره باختبار يلائم 
بداية الصف الخامس, وكذلك فللطالب الذي Gul‏ صعويات تعلم في نهاية الصف الثالث يمكن 
اختباره باختبار يلائم نهاية الصف الثاني. وفي كلا الحالتين فمن الضروري معادلة درجات 
الاختبارات من المستويين في حالة اعطاء الطالب اختبار خارج مستواه. وذلك عند مقارنته مع 
اقرانه الذين تقدموا لاختبار بمستوى الصف الفعلي نفسه. 
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شكل (5-20): تمثيل بياني للدرجات الحقيقية المتكافئة على مستويي الاختبار 


وسبب اخر لمعادلة المستويات المختلفة مشتق من الحاجة الى مخطط نمو الطقل عبر 
سنوات الدراسة والمرغوب فيه هو اشتقاق تدريج يبين درجات مستويات بطارية الاختبارات 
التحصيلية جميعهاء وهذا يتطلب معادلة الستویات. واذا ما تم هذا التدريج عبر انتقال الطفل 
من صف لاخر وتقدم لاختبارات بمستويات اكثر تقدماًء فالدرجة على الاختبار الحالي يمكن 
مقارنتها بدرجته على الاختبارات ذات المستوى الأدنى» والتدريج المناسب لمثل هذه الاختبارات 
العيارية يتطلب العادلة العمودية. ۱ 

ویمکن اجراء العادلة العمودية باستخدام اي من التصمیمات i‏ و ب أو ج) وخطیاً او 
الرتب الئينية. ففي السبعینات استخدم التصمیم أ مع معادلة الرتب الثينية في بتاء تدریج 
العدید من بطاریات الاختبارات التحصيلية. والاکثر حداثة هو استخدام معدي الاختبارات 
طرائق ونماذج السمة الکامنة في اجراء العادلة, ومثال على ذلك هو التدریج الستخدم في 
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اختبار النسخة الاصلية العدلة )1982( لاختبار ستانفورد التحصيلي» والذي اجریت معادلته 
باستخدام النموذج اللوغاريتمي احادي العلم. وكذلك معادلة تدریج نسخة )1978( لاختبار 
الهارات الاساسية الشامل وباستخدام التموذج اللوغاريتمي ثلاثي العلم 

وهنا قك بخ ان Shay Gs‏ مود اج الاد العمودية كن امتمالية کون 
UU‏ اساسا فى نوها وی اسب ال نها رقم اة لحتو فلا 
ف اكد EE‏ راك ال هوالع رو وي همست دنست الطالي على اقا 
مستوى هله 5 1 ال 24 و غو E‏ ف مس من IS)‏ )وان اراد 
dc all‏ في الریاضیات لهذین المستويين درجات على التدريج نفسه في المعادلة العمودية. مع 
انه يتم قياس 57 هدف في sal‏ الستویات و 22 هدف مشترك لکلا الستویین. ومع ذلك لا 
يعد هذا دليلاً على ان الاختبارین یقیسان سمات مختلفة, فهذا Salis‏ مقترح فقط. 

وما هي توابع کون المستويين يقيسان سمات مختلفة؟ یمکننا الاجابة عن السؤال فقط اذا 
شک تحدين ما فقا قان ییاه lags GAT Gaia ual‏ ال بان عقوم أن 
مستويين يقيسان السمة نفسها اذا كانت الدرجات الحقيقية على المستويين بينهما علاقة 
اقترانية كما هو مبين في الشكل (5-20). وفي هذه الحالة فان معرفة درجة الطالب الحقيقية 
في احد المستويات يمكننا من تحديد درجته الحقيقية في المستوى الثاني وفي حالة عدم قياس 
الستویین للسمة نفسها فإن هنالك علاقة احصائية بين الدرجات الحقيقية كما هو موضح في 
التمشيل البياني في الشکل )6-20( ويعبر هذا المنحنى عن معادلة الاقترانء والطريقة 
الستخدمة لاشتقاق معادلة الاقتران غير مهمة لاهداف المناقشة المبينة ادتاه . 


الدرجات الخقيقية 
للمستوى2 





الدرجات الحقيقية aili‏ 


شكل )6-20( تمثيل بياني للدرجات الحقيقية على مستويي الاختبار 
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افترض ان هنالك مفحوصين اثنين لهماالدرجات الحقيقة نفسها في المستوى الثانى ولكنها 
مختلفة في الستوی الاول ومشار الى الدرجات الحقيقية لهذين الفحوصین بنجمة فى الشكل 
)6-20(« وستشير الى المفحوص الذي درجته الى اليسار بالاول» وحيث ان هذا الفحوص له 
درجة حقيقية اقل في المستوى الاول من الفحوص الثاني فإنه سيحصل على درجة أقل فى 
اعفان NE al‏ وعند تحويل درجات المفحوصين الاثنين الى درجات المستوى الثاني 
باستخدام معادلة الاقتران. فان المفحوص الاول ستكون درجته اقل من درجة اللفحوص 
الثاني. وهذا يعني وضع المفحوص الاول في مكان غير ملائم. ويمكن وصف هذا بطريقة 
مختلفة «Le legs‏ وذلك اذا اعتيرنا درجة الفحوص الحقيقية تضعه في نقطة أدنى من المعادلة 
الاقترانية . وان تقدم هذا الفحوص الى صيغة الاختبار الاولى وحولت درجته الى تدريج 
صيغة الاختبار الثانية » والعكس صحيح لاي مفحوص تكون درجته الحقيقية اعلى وتقع فى 
موقع اعلی في العادلة الاقترانية. ۱ 

وعلی القاري» ان يميز ان العادلة الافقية ستکون WALA‏ فيما لو كانت الاختبارات الراد 
معادلتها لا تقیس السمة نفسها. وفي الاحوال الختلفة فإن الاختبارات العادلة افقیا تکون 
مصممة للهدف نفسه ويمستوى الصمعوية نفسه ویبدو من الضروري اعتبار الاختبارین 
يقيسان السمة نفسهاء وفي بعض الحالات تستخدم المعادلة الافقية لمعادلة اختبارین مختلفين, 
وهنا نطرح السؤال نفسه حول ما اذا كان الاختبارين يقيسان السمة نفسها 

واضافة الى احتمالية کون مستويي الاختبار لا Glands‏ السمة نفسهاء فقد تظهر مشکلات 
اخرى عند استخدام طرائق السمة الكامنة في العادلة العمودية. وسنركز هنا على المعادلة 
بوساطة النموذج اللوغاريتمي احادي العلم. والذي يعتمد على مجموعة افتراضات اساسية, 
هي 


3 تقیس فقرات الاختبار (او الاختبار الفرعی) سمة كامنة احادية البعد. 
5 لا يحاول المفحوصين تخمين الاجاية. 
هذه الافتراضات احد مصادر المهمة في المعادلة الافقية ویبدو أنه أكثر تأثيراً في العادلة 


العمودية. وعلى سبيل المثال افترض مشروع معادلة مستویین الاول يناسب الصف الثاني 
والاخر يناسب الصف الثالث؛ ويتقدم هنا طلبة الصف الثاني لاختبار الستوی الاول بالاضافة 














الى الاختبار الشترك. في حين يتقدم طلبة الصف الثالث لاختبار المستوى الثاني بالاضافة 
الى الاختبار الشترك. وفی هذه الحالة یکون الاختبار الشترك اصعب على طلبة الصف 
الثاني لهذا فان التخمين يؤثر بدرجة مختلفة على سعامل الصعوية للاختبار الشتراه لکلا 
الصفين. ولان المعادلة تعتمد تعتمد في الاساس على تقدير الفروق في معامل الصعوية لكلا الصفين 
في الاختبار المشترك فان تأثير التخمين لا يكون بالقدر نفسه لطلبة الصفين في المعادلة 
وهناك العديد من الدراساتء منها الباشر holmes, & , hoover , 1982, slinde & linn, fio‏ 
)1982 ,۰1978 ومنها غير المياشر مثل Forsyth, saisangian and Glimer , 1982 ; whitely and‏ 
Dawis , 1981 : wright 1974)‏ والتي تختبر استخدام النموذج اللوفاريتمي احادي المعلم في 
العادلة وکما هو متوقع فقد اقترح اصحاب هذه الدراسات اراء مختلفة تتعلق بقيمة النموذج 
اللوغاريتمي احادي العلم في المادلة العموديةء ویمکن اشتقاق الاختلافات في الاستنتاجات 
من اريعة مصادر على الاقل» هي : 
1. استخدام الدراسات لاختبارات مختلفة . 
2 استخد ام الدراسات لتصمیمات مختلفة . 
3. استخدام الدراسات لقياسات مختلفة للدرجات المتعادلة المتشابهة . 
4. لا يوجد محك وأضح في الدراسات للحكم على ملائمة عملية المعادلة. 
ولتوضيح هذه الاختلافات دعنا نراجع دراسات هولز )1982( وسلایند ولين )1979( 
alts,‏ الطرائق الستخدمة في هذه الدراسات من ستة cool glad‏ وعلی النحو الاتي: 
seal‏ ا لو استخدام اختبارين مختلفين في صعوباتهما, ومجموعة فقرات تمثل اختبار 
مشتركء والتي تعد جزءاً من كلا الاختبارین او انها تکون اختیارا Mis‏ 
2 تطبيق الق ات على هعزن اة 
3. تحديد مجموعتي القدرة: العالية والنخفضة» وصنفت هذه المجموعات بالاعتماد على 
محك أخر غير درجات الاختبار الممستخدم في الخطوة الاولى (دراسة سلايندولين) 
ولكنه مرتبط بالسمة المقيسة بهذه الاختبارات. 
4 ومن البيانات لفئة القدرة المنخفضة في المستوى الاولى ولفئة القدرة العالية في الستوی 
الثاني أجريث معادلة الدرجات باستخدام الطريقة الموصوفة في هذا الفصل تحت 
عنوان " العادلة باستخدام نظرية السمة الکامنة " 
5. استخدام الدرجات الخام للسمة الکامنة باستخدام جدول تحویل مشایه لجدول )9-20( 
6 مقارنة درجات السمة الکامنة لنتائج الاختبارین 
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واستنج هولز ان النموذج احادي المعلم لا یزود بمعاني كافية للمعادلة العمودية عبر مدى 
القدرة الكلي» في حين ان سلايند ولين كانا اكثر تفاؤلاً في استخدام هذا النموذج 

احدى الفروق بين الدراستين كانت في استخدام هولز لعينة مناسبة من الطلبة إذ لم 
يستخدم جدول تحويل الدرجات الخام الى درجات السمة الكامنة. وقد كرر هولز الخطوة 
السادسة في عينة الصدق» في حين ان سلايند ولين لم يكن بامكانهما استخدام هذا النوع 
من الصدق وتشير نتائج هولز الى ان المعادلة كانت آقل كفاءة عبر عينة الصدق عنها للعينة 
الأصلية. وفرق اخر بين الدراستين هو ان الفرق بين المستويات في دراسة هولز كانت أقل 
ET‏ ]کین في الصعوية من الاختبارات المستخدمة بدراسة سلايند ولين اضافة الى ان 
هولز دون الفروق بين المتوسطات العيارية لتقديرات السمة الكامنة عند كل نقطة من النقاط 
الثمانية لتدريج القدرة لكلا الستویین وتم احتساب الفروق المعيارية لكل مفحوص باستخدام 
العادلة : . 


62+ 6? 


=D‏ 1 = ريد اع ار 
G+ 2‏ /\ 
2 6 


حيث ترمز ,9 و02 الى تقديرات السمة الكامنة للمستوى الاولى والثاني على التواليء 
وترمز 002 ,082 الى تقديرات الخطأ المعياري لتقدير رو b>‏ (فان كانت المعاذلة تقمل 
بشكل مناسب فان Oy‏ يجب ان تساوي و9. وقد دوّن سلايند ولين الفرق بين المتوسطات 
لتقدير السمة الكامنة (و0-,0) لکلا الصفين, ولكنهما لم يدونا فروق المتوسطات عند النقاط 
الختلفة لتدريج السمة الكامنة واخيراً يبدو ان استنتاجات هولز لم تكن مبنية على اساس 
حجم ونمط الفروقات التي لاحظها دون محاولة جادة في اظهار كيفية تأثير قيمة هذه الفروقات 
على القرارات البنية على الاختبارء في حين ان سلايند ولين حاولا الحكم على الفروقات بدلالة 
tha‏ المعياري للقياس وعدد نقاط الدرجات الخام المكافئة لهذه الفروقات, ولكنهما لم يحاولا 
ريط هذه الفروقات بالاستخدام الفعلي للاختبارات. ونقطة مهمة تتعلق بهذه المناقشة حتى لو 
لم يكن هنالك فوارق بين دراسات كل من هولز ووسلايند ولين فمن غير المرغوب به الوصول 
الى قرارات غير متكافئة حول ملائمة استخدام النموذج احادي المعلم أو اي نموذج اخر 
للسمة الكامنةء فكل مشروع او دراسة مشابهة يجب ان تتجه نحو التحقق من ملائمة المعادلة 
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المكافكة في المعادلة: Equity in Equaling‏ 
وكما لاحظنا فان مشكلة المعادلة تكمن في تحديد دالة المعادلة f(x) = y*‏ والتي تستخدم 
في تحويل الدرجات ‏ لما يكافئها على تدريج Y‏ (وبالقليل من الطرق المتبعة في نظرية السمة 
الكامنة لتحويل درجات × و ل الى تدريج السمة الكامنةء وبقلیل من التغيرات فان المناقشة 
ادناه تنطيق على هذا النوع من المعادلة) ان هدف اشتقاق دالة المعادلة هى تحويل درجات 
الفحوصین على الاختیار × إلى درجات *ل بحيث يمكن مقارنة درجات الفحوصین الذین 
تقدموا للاختبار y‏ مع درجات الفحوصین على الاختبار x‏ والسوال الطروح هنا هو ما 

الحك اللموس او النطقي في مقارنة y‏ مع *۷. 

لقد طرح لورد (Lord,1980)‏ قضية محك المقارنةء واشار الى ان الحك يستخدم من اجل 
المكافئة او الساواة فى العادلة. ویوجد هنا محکان مهمان في هذه الحالة: الاول هو ان درجة 
الفحوص الحقيقية على Y‏ يجب ان تساوي درجته الحقيقية AY‏ والاخر ان توزيع درجات 
الخطاً للمفحوصين يجب ان یکون نفسه لكل من لاف Y‏ وان لم یتحقق اي من الحکین oB‏ 
فرصة الفحوص الحصول علی درجة ما تعتمد علی الاختبار الذي تقدم له وهنا لا تقارن 
درجات ل و * ولا نعادل درجات × و ۷ . وفي حالة توافر المحكين السابقین تعد کل من لا و 
*y‏ قیاسات متوازية اة نفسها ولها التوزیع نفسه وعند الرجوع الى هذه الحکات يمرن 
السؤالين الآتيين: 

1. هل يمكن لتطابق بیانات درجات الاختبار ان يحقق هذه المصكات؟ . 

2 هل من المکن اجراء اختیار للتحقق من تحقیق هذه الحکین؟ 

وقد وضح لورد بالنسبة للسؤال الاول انه لو كانت الاختبارات الراد معادلتها تقیس سمة 
احادية البعد لا يمكن ان تتوافق درجات ۷ و "لا مع للحکات الا اذا تم بناء كل من اختبارات 
× و ۷ بحيث یکون لكل فقرة في الاختبار × منحنی السمة نفسه لكل فقرة في الاختبار ا 
(ICC)‏ ومثل هذه الاختبارات ينتج عنها اختبارات متوازية. lay‏ انها متوازية اصلا فلا 
داعي لعادلتها لانها متكافئة اصلا 

هل نتائج لورد تعني أنه من الستحیل ان تکون الدرجات العادلة متكافئة؟ 

اولا: السمة الکامنة معرفة نظرياً فقط, لذا فان نظرية السمة الكامنة ليست صحيحة تماما . 

وثانیا: حتی لو كانت الضامین صحيحة تقریباً للاختبارات الطويلة فالاختلاف بين الصيغة 
والاخری في الدرجات الحقيقية والاخطاء العيارية الشخصي ell‏ یدکن ان يكين MELE‏ 
غير منطقي 
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ثالثا: بالاعتماد على نظريات اخرى مثل النظرية التقليدية فمن الممكن ان تصبح الدرجات 
متكافئة بعد المعادلة للاختبارات غير المتوازية. ويالنسبة للسؤال الثانى فمن الممكن اختبار 
اتقاق کل من لا *لا مع الحك. فدرجات كل منهما لها معاملات ارتباط متساوية مع المتغيرات 
الاخرى جمیعها, لذا فان فحص توافق اي من ۷ و *ل مع المحك يمكن اختباره بحساب 
معاملات ارتباطها مع متغيرات Buse‏ كذلك فانه اذا عودلت ثلاثة اختبارات او اکثر فانه 
يمكن استخدام التحليل العاملي المدوّر لاختبار امكانية تحقق الافتراضات. 





























دقيقة. ويكون البديل هو المعادلة بتطبیق نظرية السمة الكامنة مع التضمیم )>( 
٠ |‏ ودون التعيين العشوائي للمجموعات. وتستخدم كل من المعادلة الخطية والمثينية 
| بشكل مناسبمع كلا التصميمين )1 و ب) ويعتمد الاختيار بين هاتين الطريقتين 
(آو من خلال الطرائق الشلاثة في حالة استخدام نظرية الفسمة الکامنة في ٠٠ ٠‏ 
المعادلة) we‏ درجة الدقة 08 المعادلة. وهنالك اعتقاداً Li‏ بان توزیع الدرجات: : A:‏ 
| لاختبارات غذة Gyi altis‏ عدا المتوسط والاتخراف المعياري: فان MLN‏ © 
i‏ الخطية تکون ASI‏ ذقة من معادلة الرتب المئينية التساوية وعنده eS‏ 
الاختلاف في خصائص اخری غير التوسط والانحراف اف العياري بان SE‏ 
| م الرتب المثينية تكون اكثر دقة.. oe‏ = 





التمارين 
1 أعدباحث في التربية الخاصة صيغتين اختباريتين لقياس اتجاه الطلية نحو الاطفال 


التخرطين قي التخصنص etl‏ وقد انشتان هت مشراتيا 10 ی رم 


SIK 


درجات المعلمين على صيفتى اختبار الاتجاه 





استخدم هذه البيانات في 8 N‏ ( و ب) . 
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2 ارادت احدی شرکات الاختبارات معادلة صيفتي اختبار تالفت کل منهما من (10) 
فقرات» وتم تطبیق كلا الصيغتين على الجموعة نفسها وفیما يأتي جدول تكراري 
Sle ul‏ عرى کل ضیف Sy lel‏ ا هذه لفات نالا سرجات ال (i)‏ 
لتصبح على تدریج درجات الصيغة ب. 





3 يمثل الجدول الاول معامل صعوبة الفقرة (معامل راش) على صيفتي اختبار تألفت کل 
منهما من )10( فقرات. ویتضمن کل منهما 5 فقرات مشتركة مع الصيغة الاخری 
(الاختبار الشترك) وکانت الفقرات الخمس الاول للاختبار والخمس الثانية للاختبار 
الشترك. ویبین الجدول الثاني الدرجات الخام ودرجة السمة الكامنة الناظرة لها لکلا 
صيغتي الاختبار استخدم هذه البیانات في معادلة الدرجات من الصيغة أ الى الصيفة ب. 


الجدول A‏ معاملات الصعوية 











تابع جدول 1 





حدول 2 : الدرجات الخام و السمة الكامنة المقابلة : 





| 
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4 طور باحث صيختي اختبار نهائي لساق ما لشعبتين مختافتين تالف كل منهما من 
)50( فقرة )10( منها مشتركة بين الصيغتين و )40( فقرة خاصة بكل اختبار. وفیما 
يأتى درجات كل اختبار والفقرات المشتركة لكل شعبة. استخدم هذه البيانات في 
اشتقاق درجة اكل مفحوص بحيث تعكس الفقرات المشتركة والفقرات الخاصة بكل 
صبفه. 


= 3 



































الدرجات على الاختبارات المستقلة والمشتركة على صيغتي اختبار نهائي 





5 خططت شركة اختبارات معادلة صيغتي اختبار باستخدام التصميم (ب) وبطريقة 
المعادلة الخطية للصيفتينء وسيتم تحويل الدرجات على الصيغة الأولى إلى تدريج 
درجات الصيغة الثانية. ومن البحوث السابقة فمن المنطق توقع أن الأرتباط المتبادل بين 
فقرات الصيغتين أن يكون 70. و ويتباين قدره 100 لأي من الصيغتين. وتأمل الشركة 
أن يكون الخطأ المعياري للمعادلة عند التوسط للصيغة الأولى لا يزيد عن ‏ من 
الخطأ العياري للقیاس. فما حجم العينة التي يجب استخدامها لتحقيق هذا اف 
وما عدد الفحوصین اللازم فیما لو استخدم التصمیم (1)؟ 









































قائمة الراجع 

American Educational Research Association (AERA), American Psychological Association 
(APA), and the National Council on Measurement in Education (NCME), (1985). Stan. 
dards for educational and psychological testing. Washington, D.C.: American Psycholog- 
ical Association. 

American Psychological Association (APA), American Educational Research Association 
(AERA), and the National Council on Measurement in Education (NCME). (1974). Stan- 
dards for educational and psychological tests and manuals. Washington, D.C.: American 
Psychological Association. 

Anastasi, A. (1968). Psychological testing (3rd Ed.). New York: Macmillan. 

Anderson, E. B. (1973). A goodness of fit test for the Rasch model. Psychometrika, 38, 
123-140. 

Anderson, L. W. (1981). Assessing affective characteristics in the schools. Boston: Allyn 
and Bacon. 

Andrews, B. J., and Hecht, J. T. (1976). A preliminary investigation of two procedures for 
setting examination standards. Educational and Psychological Measurement, 36, 45-50. 

Angoff, W. H. (1971). Norms, scales, and equivalent scores. In R. L. Thorndike (Ed.). 
Educational measurement (2nd Ed.}. Washington, D.C.: American Council on Education. 

Angoff. W. H. (1982). Uses of difficulty and discrimination indices for detecting item bias. 
4n R. A. Berk (Ed.). Handbook of methods for detecting item bias, Baltimore: Johns 
Hopkins University Press. ۱ 

Angoff, W. H., and Ford. S. F. (4973). Item race interaction on a test-of scholastic aptitude. 
Journal of Educational Measurement, 10, 95۰ 

Baglin, R. F. (1981). Does “nationally” normed really mean nationally? Journal of Educa- 
tional Measurement, 18. 97—108. 


‘Baker. F. B. (1981). A criticism of Scheuncman’s Hem bias technique. Journal of Educa- . 


tional Measurement, 18, 59-62. 

Behuniak, P., Jr. Archambault. F. X., and Gable. R. K. (1982). Angoff and Nedelsky 
standard setting procedures: Implications for the validity of proficiency test score interpre- 
tation. Educational and Psychological Measurement, 42, 247-252. 

Berk, R. A. (1976). Determination of optimal cutting scores in criterion referenced measure- 
ment. Journal of Experimental Education, 45, 4-9 

Berk, R. A. (£978). The application of structural facet theory to achievement test construc- 
tion. Educational Research Quarterly, 3, 62-72. 

Berk. R. A. (1980a). A consumers’ guide to criterion-referenced test reliability. Journal of 
Educational Measurement, 17, 323-350. 

Berk, R. A. (1980b). kem analysis. In R. A, Berk {Ed.). Criterion-referenced measurement: 
The state of the art. Baltimore: Jobns Hopkins University Press. 

Beuchert. A. K., and Mendoza. J. L. (1979). A Monte Carlo comparison of ten item discrim- 
ination indices. Journal of Educational Measurement, 16, 109-118. . 

Binet, A., and Simon, T. (1905-1908). The development of the Binet-Simon scale. In W. 
Dennis (Ed.}. Readings in the history of psychology. Now York: Appleton-Ceatury-Crofts, 
1948, 

Birnbaum, A. (1968). Same latent trait models and their use in inferring an 5 


ability. In F, M. Lord and M. R, Novick, Statistical theories of mental test scores. Read- 
ine) Mass- Adtfican Weeleu 














Bliss. L. B. (1980). A test of Lord's assumption regarding examinee guessing behavior on 
multiple choice tests using elementary school children, Journal of Educational Measure- 
ment, 17, 147-153. 

Bloom. Benjamin S. (Ed.}. (1956). Taxonomy of educational objectives, handbook T: The 
cognitive domain, New York: McKay. 

Bloom, B. S., Hastings, J. T., and Madaus, G. F. (1971). Handbook on formative and 
summative evaluation of student learning. New York: McGraw-Hill. 

Bock. R. D., and Aitkin, M. (1981). Marginal maximum likelihood estimation of item 
parameters: Application of an EM algorithm. Psychometrika, 46, 443-460. 

` Bormuth, J. R. (1970). On the theory of achievement test items. Chicago: University of 
Chicago Press. 

Boynton, P, L. (1933). Intelligence. its manifestations and measurement. New York: D. Ap- 
pleton & Co. 

Bray. J. H.. and Maxwell, S, E. (1982). Analyzing and interpreting significant MANOVAS. 
Review of Educational Research, 52, 340-367. 

Brennan. R. L. (1972). A generalized upper-lower item discrimination index. Educational 
and Psychological Measurement, 32, 289-303. 

Breonan, R. L. (1980). Applications of generalizability theory. In R. A. Berk (Ed.), Crie- 
rion-referenced measurement: The state of the art. Baltimore: Johns Hopkins University 
Press. 5 

Brennan, R. L. (1983). Elements of generalizability theory. Iowa City: The American Col- 
lege Testing Program. ; 

Brennan, R. L., and Kane, M. T. (1977). An index of dependability for mastery tests. 
Journal of Educational Measurement, 14, 271—289. 

Brennan. R. L.. and Lockwood, R. E. (1980), A comparison of the Nedelsky and Angoff 
cutting score procedures using generalizability theory. Applied Psychological Measure- 
ment, 4, 219-240. 

° Brown, F. G., (1983). Principles of educational and psychological testing. New York: Holt. 
Rinehart, and ۰ á 

Brown, J. M., and Chang, G. (1982). The predictive validity of the Minnesota Reading 
Assessment in postsecondary vocational educational programs. Educational and Psycho- 
logical Measurement, 42, 345-352. i 

Browne. M. W. (1975). Predictive validity of a linear regression equation, British Journal of 
Mathematical and Statistical Psychology, 28. 19-87, 

Brownell, W. A. (1933). On the accuracy with which reliability may be measured by corre- 
lating test halves. Journal of Experimental Education, 1, 204-215. 

Burke, C. J. (1963). Measurement scale and statistical models, In M. H. Marx (Ed.). Theo- 
ries in contempory psychology. New York: Macmillan. 

“Rurril, L. E. (1982). Comparative studies of item bias methods. in R. A. Berk (Ed.). ۰ 
book of methods for detecting item bias. Baltimore: Johns Hopkins University Press. 

Camilli, G. (1979). A critique of the chi-square method for assessing item bias, Unpublished 
paper, Laboratory of Educational Research, University of Colorado. 

Campbell, D. T., and Fiske, D, W. (1959). Convergent and discriminant validation by the 
multitrait-multimethod matrix. Psychological Bulletin, 56, 8۱۰ 

Campbell, D. T., and Stanley, J. C. (1963). Experimental and quasi-experimental designs 
for research on teaching. Chicago: Rand McNally & Company. | 

Cardall, C., and Coffman, W, E. (1984). A method for comparing the performance of 























== 7 











different groups on the items in a test. (ETS Research Bulletin 64-61). Princeton, N.J.: 
Educational Testing Service. 

Chissom, B. S., and Hoenes, R. L. (3976). A comparison of the ability of the D-48 test and 
the IPAT Culture Fair Intelligence Test to predict SRA achievement test scores for 8th and 
9th grade students. Educational and Pychological Measurement, 36, 561-564 

Cleary, T. A. (1968). Test bias: Prediction of grades of Negro and white students in inte- 
grated colleges. Journal of Educational Measurement, 5, 115—124. 

Cleary, T. A., and Hikon, T. L. (1968). An investigation of item bias. Educational and 
Psychological Measurement, 28, 61-75. 

Cole, N. S. (1973). Bias in selection. Journal of Educational Measurement, 10, 237-255. 

Coombs, C. H. (1950a). The concepts of reliability and homogeneity. Educational and 
Psychological Measurement, 10, 43-56. 

Coombs, C. H. (1950b). Psychological scaling without a unit of measurement. Psychological 
Review, 57, 145-158. 

Cox, R. C. (1965). ltem selection techniques and evaluation of instructional objectives. 
Journal of Educational Measurement, 2, 181-185. 

Cox, R. C., and Vargas, J. S. (1966). A comparison of item selection techniques for norm- 
referenced and criterion-referenced tests. Paper presented at the annual meeting of the 
National Council on Measurement in Education. 

Cronbach, L. J. (1951). Coefficient alpha and {he internal Structure of tests. Psychometrika, 
16, 297-334. 

Cronbach, L. J. (1970). Review of On the theory of achievement test items. Psychometrika, 
35, 509-514. 

Cronbach, L. J. (1971). Test validation. In R. L. Thorndike (Ed.). Educational Measurement 
(2nd Ed.), Washington, D.C.: American Council on Education. 

Cronbach, L. J, (1973). Disciplined inquiry. In H. S. Broudy (Ed.}. Philosophy of educa- 
tional research. New York: John Wiley. 

Cronbach, L. J. (1975). Five decades of public controversy over mental testing. American 
Psychologist, 30, 1-14. 

Cronbach, L. J. (1976). Equity in selection: When psychometrics and political phitosophy 
meet. Journal of Educational Measurement, 13, 31-41. 

Cronbach, L. .ل‎ Gleser, G. C., Nanda, H., and Rajaratnam, N. (1972). The dependability of 
behavioral measurements. New York: John Wiley. 

‘Cronbach, L. J., Gleser, G. C. and Rajarainam, N. (1963). Theory of generalizability. A 
liberalization of reliability theory. British Journal of Mathematic al and Statistical Psychol- 
ogy, 16, 137-173. 

Cronbach, L. J., and Meehl, P. E. (1955). Construct validity in psychological tests. Psycho- 
logical Bulletin, 52, 281-302 

Cronbach, L. J., and Warrington, W. G. (1952). Efficacy of multiple choice tests as a 
function of spread of hem difficulties. Psychometrika, 17, 127-147. 

Cross, f.. and Frary, R. (1977). An empirical test of Lord's theoretical results regarding 
formula scoring of multiple choice tests. Journal of Educational Measurement, 14, 313~ 
322. 

‘Cureton, E. E. (1950). Validiy, reliability, and baloney. Educational and Psychological 
Measurement, 10, 94-96. 

Cureton, E. E. (1958). The definition and estimation of test laiis: Educational Psycho- 
logical Measurement, 18, 745-738. 








Darlington, R. B. )1970(. Some techniques for maximizing a test's validity when the crite- 
rion variable is unobserved. Journal of Educational Measurement, 7, ۱۳, 

Darlington, R. B. (1971). Another look at culture faimess. Journal of Educational Measure. 
ment, 8, 71~82. ۱ 

Davis, C. E., Hickman, J., and Novick, M. R. {1973}. A primer on decision analysis for 
individually prescribed instruction. (ACT Technical Bulletin د‎ 17). lowa City: Ameri- 
can College Testing Program. 

Davis, F. B. and Fifer, G. (1959). The effect on tesi reliability ‘and validity on scoring 
aptitude and achievement tests with weights for every choice. Educational and-Psycholog- 
ical Measurement, 14, 159-170 

Dawes, R. M. (1972), Fundamentals of attitude measurement. New York: John Wiley. 

Dennis, W. (Ed). (1948). Readings in hê history of psychology. New York: Appleton-Cen- 
tury-Crofts. 

Diamond, J., and Evans, ۰ ور‎ The correction for guessing. Review of Educational 
Research, 43, 181-191. 

Dixon, W. J., Brown, M. B., Engelman, L., Frane, J. W., Hill, M. A., Jenarich, R. L, and 
Toporek, J. D. (1981). BMDP statistical software. Berkeley: University of Califomia 
Press. 

Downey, R. G. (1979). ‘Ttem-option weighting of sehievenient tests: Comparative study of 
methods. Applied Psychological Measurement, 3, 453-462. 

DuBois, P. (1970). A Aistory of psychological testing. Boston: Allyn and Bacon. 

Ebel, R. L. (1951). Estimation of the reliability of ratings. Psychometrika, 16, 407-424. 

Ebel, R. L. (1956). Obtaining and reporting evidence on content validity. Educational and 
Psychological Measurement, 16, 269-281. 

Ebel, R. L. (1962). Content standard test scores. Educational anid Psychological Measure- 
ment, 22, 15-25 

Ebel, R. L. (1965). Measuring educational achievement, RIPETAS Cliffs, N.J.: Prentice: 
Hall. 

Ebel, R. L. (1968). The value of internat consistency in classroom examinations. Journal of 
Educational Measurement, 5, 71-74. 

Ebel, R. L. (1972). Essentials of educational measurement (2nd Ed.). Englewood ciiffs, 
N.J.: Prentice-Hall. 

Ebel, R. L. (1982). Proposed solutions to 5 problems of test construction. Journal of 
Educational Measurement, 19, 267-278. ; 

Echtemacht, G. J. (1972). The use of confidence testingin ai tests. Review of Educa- 
tional Research, 42, 217—236. 

Echtemacht, G. J. (1974). A quick method for determining item bias. Educational and 
Psychological Measurement, 34, 211—280. 

Echternacht, G. (1977). Grade-equivalent scores. Measurement in Education, 8(2), 1-4. 

Englehart, M. D. (1965). A comparison of several item discrimination indices, Journal of 
Educational Measurement, 2, 69-76. 

Fahner, S. (1974). Hem sampling and decision making in achievement testing. British ار‎ 
nal of Mathematical and Statistical Psychology, 27, ۱2175. ` 

Fechner, G. T. (£860). Elements of psychophysics. In W. Dennis (Ed.), Readings in the 
history of psychology. New York: Appleton-Century-Crofis, 1948. 

Findley, W. G. (1956). A rationale for evaluation of item discrimination statistics. Educa- 
tional and Psychological Measurement, 16, 175-180. 





== 639 
































س 640 


Fishbein, M. (Ed.). (1967). Readings in attitude theory and measurement, New York: John 
Wiley. : 

Flanagan, 3. C. (1954). The critical incident technique. Psychological Bulletin, 51, 321 
358. 

Forsyth, R., Saisangjan, V., and Gilmer, J. (1981). Some empirical results related to the 
robustness of the Rasch model. Applied Psychological Measurement, 5, 175-186. 

Frederiksen, N. (1981). The real test bias. (Research Report No. 81—40}. Princeton, N.J.: 
Educational Testing Service. 

Frick, T., and Semmel, M. 1. (1978). Observer agreement and reliabilities of classroom 
observational measures. Review of Educational Research, 48, 157-184 


Frisbie, D. A., and Brandenburg, D. C. (1979). Equivalence of questionnaire items with 


varying response formats. Journal of Educational Measurement, 16. 43-48 

Galton, F. (1883). Inquiries into human faculty and its development. In W. Dennis (Ed). 
Readings in the history of psychology. New York: Appleton-Century-Crofis, 1948. 

Ganapole, S. J. (1980). The fundamental reading competencies test. Journal of Educational 
Measurement, 7, 71-73. 

Gardner, P. L. (1975). Scales and statistics. Review of Educational Research, 45, (1), 43~ 
58. 

Gavin, A. T. (1977). Guide to the development of written tests for selection and promotion: 
The content validity model. (Technical memorandum 77-6}. Washington D.C.: U.S. Civil 
Service Commission. 

Gilman, D. A., and Ferry, P. (1972). Increasing test reliability through self-scoring proce- 
dures. Journal of Educational Measurement, 9, 205-207 ۰ 

Glaser, R. (1963). Instructional technology and the measurement of learning outcomes. 
American Psychologist, 18, 519~52}. 

Glass, G. V. (1978). Standards and criteria. Journal of Educational Measurement, 15, 237- 
262. 

Gleser, G. C., Cronbach, L. Ï., and Rajaratnam, N. (1965). Generalizability of scores influ- 
enced by multiple sources of variance. Psychometrika, 30, 395-418. 

Gordon, J}. J. (1967). A test manual for the How 1 See Myself Scale. Florida Educational 
Rescarch and Development Council. ۲ 

Gross. A, L., and Su, W. (1975). Defining a “fair or “unbiased'' selection model: A 
question of utilities. Journal of Applied Psychology, 60. 345~351. 

Guertin, W., H., and Bailey, J. D., Je. (1970). Introduction to modern factor analysis. Ann 
Arbor, Mich.: Edwards Brothers.” ot 

Guilford, J. P. (1954). Psychometric methods (2nd Ed.). New York: McGraw-Hill. 

Guion, R. M. (1979). Conient validity—the source of my discontent. Applied Psychological 
Measurement, 1, 1-10. - 

Guion, R. M. (1978). ‘Content validity مس‎ moderation. Personnel Psychology, 31, 205- 
213. 

Guion, R. M. (1980). On trinitariad doctrines of validity. Professional Psychology, ۰ 
385-398. 

Gulliksen, H. (1945). The relation of item difficulty and inter-item correlation to test vari- 
ance and reliability. Psychometrika. 10. 79-91. 

Gulliksen, H, (1950). Theory of mental tesis. New York: John Wiley. 

Gupta. S. S. (1963). Probability integrals of multivariate normal and multivariate t. Annals of 
Mathematical Statistics, 34, 792—828. 

Gustafsson, J. E. (1980). A solution of the conditional estimation problem for long tests in 











the Rasch mode! for dichotomous items. Educational and Psychological Measurement, 
40, 377-385. 

Guttman, L. {1941a}. An outline of the statistical theory of prediction. In P. Horst et al. 
(Eds.). The prediction of personal adjustment, New York: Social Science Research Coun- 
cil. 

Guttman, L. (1941b). The quantification of class attributes: A theory and method of scale 
construction. In P. Horst et at. (Eds.). The prediction of personal adjustment. New York: 
Social Science Research Council. 

Guttman, L. (1945). A basis for analyzing test-retest reHability. Psychometrika, 10, 255- 
282, 

Guttman, L. (1950). The basis for scalogram analysis. In S. A. Stouffer et al., + Measurement 
and prediction. Princeton, N.J.: Princeton University Press. 

Guttman, L. (1969), Integration of test design and analysis. Proceedings of th the 1969 invita- 
tional conference on testing problems, Princeton, N.J.: Educational Testing Service. 
Hambleton, R. K. (1978). On the use of cutoff scores with criterion-referenced tests in 

instructional settings. Journal of Educational Measurement. 15, 277-290. 

Hambleton, R. K. (4980). Test score validity and standard setting methods. In R. A. Berk 
(Ed.). Criterion-referenced measurement: The state of ihe art. Baltimore: Johns Hopkins 
University Press. 

Hambleton, R. K. (Ed.). (1983). Applications of item response theory. Vancouver: Educa- 
tional Research Institute of British Columbia. 

Hambleton, R. K., and Cook, L. L. (1977). Latent trait models and their use in the analysis 
of educational test data. Journal of Educational Measurement, 14, 7596. 

Hambleton. R. K., and Murray, L. (1983). Some goodness of fit investigations for item 
response models. fn R. K. Hambleton (Ed.). Applications of item response theory. Van- 
couver: Educational Research Institute of British Columbia. 

Hambleton, R. K., and Novick, M. R. (1973). Toward an integration of theory and method 
for criterion-referenced tests. Journal of Educational Measurement, 10, 159-170. 

Hambleton, R. K., Swaminathan, J., Algina, J., and Coulson, D. B. (1978a). Criterion-ref- 
erenced testing and measurement: A review of technical issues and developments. Review 
of Educational Research, 48, 1-47. 

Hambleton, R. K., Swaminathan, H., Cook, L. L., Eignor, D. R., and Gifford. J. A. 
(1978b). Developments in tatent trait theory: Models, technical issues, and applications. 
Review of Educational Research, 48, 467-510. 

Hambleton. R. K., and Traub, R. E, (1971). Information curves and efficiency of three 
logistic test models. British Journal of Mathematical and Statistical Psychology. 24. 273~ 
281, 

Hanna, G. S. (1975), Incremental reliability and validity of multiple choice tests with an 
answer-until-correct procedure, Journal of Educational Measurement, 12, 175-178, 
Harman, H. H. (1967). Modern factor analysis (2nd Ed.). Chicago: University of Chicago 

Press. 

Harris, C. W. (1974), Problems of objectives-based measurement, In C. W. Harris, M. C. 
Alkin, and W. J. Popham (Eds.}. Problems in criterion referenced measurement. (CSE 
monograph series in evaluation No. 3). Los Angeles: CENE for the Study of Evaluation. 
University of California. 

‘Harris, C. W., Alkin, M, C., and Popham. W. J. (1974). Problems in criterion referenced 
measurement, (CSE monograph series in evaluation, No. 3). Los Angeles: Center for the 
Study of Evaluation, University of Cafifornia. 








= 641 سس 












































Harris, C. W., and Pearlman, A. P. (1977). Conventional Significance tests and indices of 
agrcement or association. In C. W. Harris, A. P. Pearlman, and R. R. Wilcox (Eds.). 
Achievement test items—Methods of study, (CSE monograph series in evaluation, No. 6} 
Los Angeles: Center for the Study of Evaluation, University of California. 

Harris, C. W., Pearlman, A. P., and Wilcox, R. R. (1977). Achievement test items-— 
Methods of study. (CSE monograph series in evaluation, No. 6). Los Angeles: Center for 
the Study of Evaluation, University of California. ve 

Hartley, A. A., and Hanley, J. T. (1976). Predicting performance in the basic research 
methods course in psychology. Educational and Psychological Measurement, 36, 449- 
452. 

iays, W. L. (1981). Statistics for psychologists. New York: Holt, Rinehart and Winston. 

Hendrickson, G. F. (1971). The effect of differential option weighting on multiple choice 
objective tests. Journal of Educational Measurement, 8, 291-296 

Henryssen, S. (1971). Gathering, analyzing and using data on test items. In R. L. Thorndike 
(Ed.}. Educational measurement (And Ed.). Washington, D.C.: American Council on 
Education. l ۱ 

Hilton, T. L., and Rhen, H. (1973). The base year study of the national longitudinal study of 
ihe high school class of 1972. (Final Report Contract No. OEC-0-72-0903). Office of 
Education, National Center for Educational Statistics, U.S. Deparment of Health, Educa- 
tion, and Welfare, Princeton, N.J.: Educational Testing Service. : 

Hocking, R. R. (1976). The analysis and selection of variables in linear regression. 
Biometrics, 32, 1-49. 

Holland, W. F., and Keller, R. T. (1978). A crass validation study ofthe Kirton Adaptation- 
Innovation Inventory in three research and development organizations. Applied Psycholog- 
ical Measurement, 2, 510-563, : 

Holmes, S. E. (1982). Unidimensionality and vertical equating with the Rasch model. Jour- 
nal of Educational Measurement, £9, 139—147. 

Hoyt, C. J. (1941). Test reliability estimated by analysis of variance, Psychometrika, 6, 
153-160. 

Hulin. C. L., Drasgow, F., and Parsons, ©. K. (1983). Hem response theory. Homewood 
HL: Dow Jones-Irwin. 

Hulin. C. L., Lissak, R. 1., and Drasgow, F. (1982). Recovery of two and three parameter 
logistic item characteristic curves: A Monte Carlo study. Applied Psychological Measure- 
ment, 6, 249-260. : ۱ f 

Hunter. F.E. (1975). A critical analysis of the use of item means and item test correlations to 
deicemine the presence or absence of content bias in achievement test items. Paper pre 
sented at the National Institute of Education Conference on Test Bias, Annapolis, Md. 

Hunter, J. E., and Cohen, S. H. (1974). Correcting for unreliability in nonlinear models of 
attitude change. Psychometrika, 34, 445—468. 

Hunter. J. E., and Schmidt. F. L. (1976). A critical analysis of the statistical and ethical 
implications of various definitions of “iest bias.” Psychological Bulletin, 83, 4,053- 
1.071. 

Huavh. H. (1976a). On the reliability of decisions in domain-referenced testing. Journal of 
Educational Measurement, 13, 253-264 

Hunyh. H. (1976b). Statistical considerations of mastery scores. Psychomerrika, 4], 65-78. 

Hunyh. H. (1980a). Computation and inference for two reliability indices in mastery testing 
based on the beta-binomial model. In H. Hunyh and J. C, Saunders. Solutions for some 
technical problems in domain-referenced mastery testing. (Finat Report, Project No. NIE- 














G-78-0087). National institute of Education, Department of Health, Education, and Wel- 
fare. 

Hunyh, H. (1980b). A nonrandomized minimax solution for passing scores in the binomial 
error model. Psychometrika, 45. ۱67۰ 

Hunyh, H. (1980c). A note on decision theoretic coefficients for tests. In H. Hunyh and J. 
C. Saunders. Solutions for some technical problems in domain-referenced mastery testing. 
(Final Report, Project No, NIE-G-78-0087). National Institute of Education, Department 
of Health, Education, and Welfare. 

Hunyh, 11. (1980d). Statistical inference for false positive and false negative error rates in 
mastery testing (computer program and tables added), In H. Hunyh and J. C. Saunders. 
Solutions for technical problems in domain-referenced mastery testing. (Final Report, 
Project No. NIE-G-78-0087). National Institute of Education, Department of Health, Edu- 
cation, and Welfare. 

Hunyh, H., and Saunders, J. C. (1980), Accuracy of two procedures for estimating reliability 
of mastery tests. Journal of Educational Measurement, 17, 331-338. 

Jennrich, R. t., and Sampson, P. F. (1966). Rotation for simple loadings. Psychometrika, 31, 
313—323. 

fronson, O. H. (1982). Use of chi-square and latent trait approaches for detecting item bias. 
In R. A. Berk (Ed.). Handbook of methods for detecting item bias, Baltimore: Johns 
Hopkins University Press. 

‘ronson, G., Homan, S., Willis, R., and Signer, B. (In press). The validity of item bias 
lechniques with math word problems. Applied Psychological Measurement. 

ronson, G. H., and Subkoviak, M. (1979). A comparison of several methods for assessing 
item bias. Journal of Educational Measurement, 16, 209-223. 

Irvin, L. K., Halpern, A. S.. and Landman, J. T. (1980). Assessment of retarded student 
achievement with standardized true/false and multiple-choice tests. Journal of Educational 
Measurement, 17, 51-58 

Jaeger, R. M. (1979). Measurement consequences of selected standard- setting models. In ۰ 
A. Bunda, and J. R. Sanders (Eds.}. Practices & problems in competency based measure- 
ment, National Council on Measurement in Education. 

Jaeger, R. M, (1982). An iterative structured judgment process for establishing standards on 
competency tests: Theory and application. Educational Evaluation and Policy Analysis, 4, 
461-475. 

Jaeger, R. M. (1984). Sampling in education and the social sciences. New York: Longman. 

Jensen, A. R. (1980). Bias in mental testing. New York: The Free Press. 

Jersitd, A. J. (1952). In search of self. New York: Teachers College Bureau of Publica- 
tions. 

Joncich, G. M. (1968). The sane positivist: A biography of Edward L. Thorndike, Middle- 
town, Conn.: Wesleyan University Press. 

Jéreskog, K. G. (1969), A general approach to confirmatory maximum likelihood factor 
analysis. Psychometrika, 34, 183—202. 

Jéreskog, K. G., and Sorbom. D. (1984). LISREL VI, Analysis of Hoear structural relation- 
ships by maximum likelihood, instrumental variables, and least squares methods. Moores- 
ville, ind.: Scientific Software, Inc. 

Kaiser, H. G. (1958). The varimax criterion for analytic rotation in factor analysis. 
Psychometrika, 23, 187-200. 

Kane, M. T. (1982). A sampling model for validity. Applied Psychological Measurement, 6, 
125—160. 


=== 3 


























Kane. M. T., and Brennan, R. L. (1980), Agreement coefficients as indices of dependability 
for domain-referenced tests. Applied Psychological Measurement, 4, 105-126. 

Kane, M. T., Gillmore, G. M., and Crooks, T. J. (1976). Student evaluations of teaching: 
The generalizability of class means. Journal of Educational Measurement, 13, 17| ~84, 

Kaplan, R: M., and Saccuzzo, D. P. (1982). Psychological testing principles, applications, 
and issues. Monterey, Calif.: Brooks/Cale. 

Katz, M. (1958). Selecting an achievement test: Principles and procedures. In V. H. Noll, D, 
P. Scannell, and R: P, Noll (Eds.). Introductory readings in educational measurement, 
Boston: Houghton Mifflin, 1972. 

Keats, J. A., and Lord, F. M, (1962). A theoretical distribution for mental test scores. 
Psychometrika, 27. 215-231 1 

Kelley, T. L. (1927), Interpretation of educational measurements, New York: World Book. 

Kelley, T. L. (1939). Selection of upper and lower groups for the validation of test items. 
Journal of Educational Psychology, 30. 17-24. 

Kelley, T. L. (1942). The reliability coefficient. Psychometrika, 7, 75-83. 

Kiefer, J., and Wolfowitz, J, (1956). Consistency of maximum likelihood estimates in the 


presence of infinitely many incidental parameters, Annals of Mathematical Statistics, 27, 
8587-0 

Kish, L. (1965). Survey sampling. New York: John Wiley. 

Klein, S. P., and Kosecoff, J. P. (1975). Determining how well a test Measures your objec- 
tives. (CSE Report No. 94). Los Angeles: Center for the Study of Evatuation, University 
of California. : 

Kleinbaum, D. G., and Kupper, L. L. (1978). Applied regression anal¥sis and other muitis 
variable methods. North Scituate, Mass.: Duxbury Press. 

Koffler, S. L. (1980). A comparison of approaches for setting standards. Journal of Eduea- 
tional Measurement, 17. 167-18 

Kolen, M. J. (1984). Effectiveness of analytical smoothing in equipercentile equating. Jour- 
nal of Educational Statistics, 9, 25-44. . 

Krathwohl, D. R., Bloom, B. 5, and Masia, B, (1964). Taxonomy of educational objectives, 
handbook I: The affective domain. New York: McKay. 

Kuder, G. F.. and Richardson, M. W, (1937). The theory of the estimation of test reliability. 
Psychometrika, 2, 151-160. 

Kurtz. A. K., and Mayo, S.T. ¢ 1979). Statistical methods in education and Psychology, New 
York: Springer-Verlag. ۲ 

Lam, T. C. M., and Kilockars, A. j. (1982). Anchor point effects on the equivalence of 
questionnaire items. Journal of Educational Measurement, 19, 317-322. 

Lange. A.. Mchrens, W., A., and Lehmann, I. J. (1967). Using item analysis to improve 
tests. Journat of Educational Measurement, d, 65-68 

Lawley, D. N, (1943). On problems Connected with jtem selection and test construction. 
Proceedings of the Royal Soctety of Edinborough, 6, 73-7 

Lawley, D. N., and Maxwell, A. E, (1971). Factor analysis as a statistical method {2nd 
Ed.). New York: American Elsevier Publishing Company. 

Lawshe, C, H. (1975). A quantitative approach to content validity. Personnel Psychology, 
28. 563-575. 

‘Levine, M. Vv, (1981). Weighted item bias statistics. fReport 81-5), Urbana-Champaign: 
Department of Educational Psychology. University of Hinois. 
Levine, M, V., Wardrop. J. L., and Linn, R. L. £1982). Weighted mean square item bias 


suitistics, Paper Presented at the annual meeting of the American Educational Research 
Association. New York. 




















Likert, R, (1932). A technique for the measurement of attitudes. Archives of Psychalogy, 
(140), 44-3 

Lindquist, E. F. (1936). The theory of test construction. In H. E. Hawkes, E. F. Lindquist, 
and C, Mann (Eds.}. The construction and use of achievement examinations. Boston: 
Houghton Mifflin. 

Lindquist, E. F. (1953). Design and analysis of experiments in education and psychology. 
Boston: Houghton Mifflin. | 

Linn, R. L. (1973). Fair test use in selection, Review of Educational Research, 43, 343-- 
357. 

binn, R. L., Levine, M. V., Hastings, C. N., and Wardrop, J. L. (1981). item bias in a test 
of reading comprehension, Applied Psychological Measurement, 5, 159-173. 

Livingston, S. A. (1972). Criterion-referenced applications of classical test theory. Journal 
of Educational Measurement, 9, 13-26. 

Loevinger, J, (1947). A systematic approach to the construction and evaluation of tests of 
ability, Psychological Monograph, 61, No. 4. 

Loevinger, J. (1954). The attenuation paradox in test theory, Psychological Bulletin, 51, 
493-504. f ; 

Lomax. R. G. and Algina, J. (1979). Comparison of two procedures for analyzing multitrait 
multimethod matrices. Journal of Educational Measurement, 16, 177-186. 

Lord, F, M. (1952a). The relationship of the reliability of multiple choice items to the 
distribution of item difficulties. Psychometrika, 18, 181~194. 

Lord. F. M. (1952b}. A theory of test scores. Psychometric Monograph, No. T: 

Lord, F. M. (1953). The relationship of test score to trait underlying the test. Educational and 
Psychological Measurement, 13, 5317-48 

Lord, F. M. (1955). Sampling fluctuations resulting from the sampling of test items. 
Psychometrika, 20, 1-22. 

Lord, F. M. (1957). Do tests of the same length have the same standard error of measure- 
ment? Educational and Psychological Measurement, 17, 510-521. 

Lord, F, M. (1959a). Test norms and sampling theory. Journal of Experimental Education, 
27, 247-263. 

Lord, F. M. (1959b). Tests of the same length do have the same standard error of mensure- 
ment. Educational and Psychological Measurement, 19, 233-239 

Lord, F, M. (1963). Formula scoring and validity. ( and Psychological Measure- 
ment, 23, 663—672. 

Lord. F. M. (1965). A strong truc-score theory with application, Psychometrika, 30, 239-- 
270. 

Lord. F. M. (1968). An analysis of the Verbal Scholastic Aptitude Test using Birnbaum’s 
thrée-parameter logistic model. Educational and Psychological Measurement, 28, 989 


1020. 
Lord, F. M. (1971). The self scoring flexilevel test. Journal of Educational Measurement, 8. 
147-151. 


Lord. F. M. (1975). Formula scoring and number-right scoring. Journal of Educational 
Measurement, 12, 7-12. 

Lord, F. M. (1980). Applications of item response theory to practical testing problems. 
Hillsdale, N.J.: Lawrence Erlbaum. 

F. M. (1982). The standard error of equipercentile equating, Journal of Educational‏ امل 
Statistics, 2, 165-192.‏ 

Lord, F. M., and Novick, M. R, (1968). Statistical theories.of mental test scores. Reading, 
Mass.: Addison-Wesley, 1968. 


== 645 















































Loyd, B. H., and Hoover, H. D. (1980). Vertical equating using the Rasch model. Journal of 
Educational Measurement, £7, 179-193. 

McCall, W. A. (1939). Measurement, New York: Macmillan. 

McClung, M. S. (1978). Developing proficiency programs in California public schools: 
Some legal implications and a suggested implementations schedule. Sacramento, Califor- 
nia State Department of Education. 

McDonald, R. P. (1981). The dimensionality of tests and items, British Journal of Mathe- 
matical and Statistical Psychology, 34, 100-147. 

MecNemar, Q. (1962). Psychological statistics. New York: John Wiley. 

“McNemar, Q. (1975). On so-called test bias. American Psychologist, 30, 848-851. 

Magnusson, D. (1967). Test theory. Boston: Addison-Wesley. 

Marascuile, L. A., and McSweeney, M. (1977). Nonparametric and distribution free erke 
ods for the social sciences. Monterey, Calif: Brooks/Cole. 

Marco, G. (1977). Item characteristic curve solutions to three intractable testing problems. 
Journal of Educational Measurement, 14, 139-160. 

Marsh, H. W., and Hocevar, D. (1983). Confirmatory factor analysis of muldtrait-mult- 
method matrices. Journal of Educational Measurenient, 20, 231-248. 

Marx. R. W., and Winne, P. H. (1978). Construct interpretations of three self-concept inven- 
tories. American Educational Research Journal, 15, 99-109, 

Masters, J. R. (1974). The relationship between number of response categories and reliability 
of Likert-type quéstionnaires, Journal of Educational Measurement, 11, 49-53. 

Matarazzo, J. D., Allen, B. V., Sosiow, G., and Weins, A. N. (1964). Characteristics of 
successful policemen and firemen applicants. Journal of Applied-Psychology, 48, 123~ 
133. 

Medley, D. M., and Meitzel, H. È. (1963). Measuring classroom behavior by systematic 
observation. in N. L. Gage, Handbook of research on teaching. Chicago: Rand McNally. 
Mehrens, W. A., and Lehmann, 1. J. (1984). Measurement and evaluation in education and 

psychology (3rd ed.}. New York: Holt, Rinehart, and ۰ 

Meskauskas, J, A, (1976). Evaluation models for criterion-referenced testing: Views regard- 
ing mastery and standard setting, Review of Educational Research, 46, ۱33 

Messick. S. (1975). The standard problem: Meaning and values in measurement and evalua- 
tion. American Psychologist, 30. 955-966, 

Messick, S, (1981). Evidence and ethics in the evaluation of tests. Educational Researcher, 
(۵ بر‎ 9-20. 

Millman, J. )1973(. Passing scores and test lengths for crilerion-referenced tesis, Review of 
Educational Research, 43, 205-216. 

Millman, J. (1974). Criterion referenced measurement. In WLS. Popham (Ed.). Evaluation in 
education: Current applications, Berkeley. Calif: McCutcheon, 

Millman, J.. and Glass. O. V. (1967). Rules of thumb for writing the ANOVA table. Journal 
of Educational Measurement. d, 44-51. 

Milman, J., and Popham, W. j. {1974}. The issue of item and test variance for criterion-ref- 
erenced tests: A reply. Journal of Educational Measurement, JF, 137-438. 

Mills, C. N. (1983). A comparison of three methods of establishing cutoff scores on criterion 
referenced tests. Journal of Educational Measurement, 20, 283-292. 

Morrison, D. F (1976). Afdtivariate statistical methods (2nd Ed). New York: MeGraw- 
Hill. 

Mosher. D. L. (1963). Measurement of guilt in females by self-report inventories, Journal of 
Consulting and Clinical Psychology, 22, 690-6595 

















Mosier, C, F (1947). A critical examination of the cuncepts of face validity. Educatonal and 
Psychological Measurement, 7, 191-206. 

Mulaik, $. A. (1972). The foundations of factor analysis, New York: McGraw-Hill. 

Myers, J. L. (1979). Fundamentals of experimental design (3rd Ed.}. Boston: Allyn and 
Bacon. 

Nedetsky, L. (1954). Absolute grading standards for objective tesis. Educational and Psy- 
chological Measurement, f4, 3-19. i 

Novick, M. R., and Lewis, C. (1974). Preseribing test length for criterion referenced meg- 

surement. In C. W. Harris, M. C. Alkin, and W. J, Popham (Eds.). Problems in criterion- 

referenced measurement, Los Angeles: Cemer for the Study of Evaluation, University of 

California, 

Novick, Nf. R., and Lindley, D. V. (1978). The use of more realistic utility functions in 
educational applications. Journal of Educational Measurement, 15, 181-491. 

Nunnally, J. C. (1967). Psychometric theory. New York: McGraw-Hill. 

Osgood, C., Suci, G., and Tannenbaum, P. (1957). Phe measurement of meaning, Urbana: 
University of Hlinots Press. 

Oosterhof, A. C. (1976), Similacity of various item discrimination iudices. Journal of Edu- 
cational Measurement, 13, 145-150. 

Overall, 4. E., and Klett, C. J. (1972). Applied E analysis, New York: MeGruw- 
HIH. 

Patnaik, D., and Traub, R. E. (1973). Differential Genie by judged degree of correct- 
ness. Journal of Educational Measurement, 10, 281-286. 

Pearson, K. (1909). On a new method of determining a correlation between a measured 
character of A and a character of B, of which only the percentage of cases wherein B 
exceeds (or falls short of} intensity is recorded for each grade of A. Biometrika, 7, 96- 
105. 

Pedhazur, E. J. (1982). Afudiplé regression in behavioral research (2nd Ed.), York: Holt, 
Riachact, and Winston. 

Peng, C. J., and Subkoviak, M. J. (1980). A note on Hunyh’s normal approximation proce- 
dure for estimating critetion-referenced reliability, Journal of Educational Measurement, 
#7, 359-368. 

Petersen, N. S. (1976). An expected utillty model for “‘opuonal”’ sélection: Journal ef 
Educational Statistics, 1, 333-358. 

Petersen, N. S. (1979), Review of Achievement test items: Methods of study by Chester ۰ 
Harris, Andrea Pastorak Pearlman, and Rand R, Wilcox. Journal of Educational Measure- 
ment, 16, 137-138. 

Petersen, N. S., and Novick, M. R. (1976), An evaluation of some modets for culture-fair 
selection. Journal of Educational Measurement, £3, 3-29. 

Piers, &. V., and Harris, D. B. (1964). Age and other correlates of self-concept. Jearnal of 
Educational Psychology, 35, 91-98, f 

Piake, B. S., and Hoover, H. D. (1977). An analyde method of identifying biased test nems. 
Paper presented at the annual meeting of the American Educational Research Association, 
New York. 

Popham, W. J. (1974). Selecting objectives and generalizing test Hems. In C, ۱۷۰ Harris, M, 
C. Alkin, aad W. J. Popham {Eds.). Problems in criterion-referenced measurement. (pp. 
13-25). Los Angeles: Center for the Study of Evaluation, University of Catifornia. 

Popham, W. J. (1978). As always, provocative. Journal of Educational Measurement, 13, 
297 - 300. 





=== 647 























س 648 





Popham, W. J. (1981). Modern educational measurement. Englewood Cliffs, N.J.: Prentice- 
Hall. 

Popham, W. J., and Husck, T. R. (1969). Implications of eriterion-referenced measurement, 
Journal of Educational Measurement, 6, 1~9. 1 

Pough, F. H. (1960), A field guide to rocks and minerals. Boston: Houghton Mifflin. 

Powers, D. E. (1982). Long term predictive and construct validity of two traditional predic- 

, _ tors of law school performance. Journal of Educational Psychology, 74, 568-576. 

Powers, S.. Slaughter, H., and Helmick, C. (1983). A test of the equipercentile hypothesis 
of the TIERS norm-referenced model. Journal of Educational Measurement, 20, 299- 
302. 1 

Prescott, 0. A., Balow, I. H., Hogan, T. P., and Farr, R. C. (1978). Metropotitan Achieve- 
ment Tests. New York: The Psychological Corporation. 

Prien, E. P. (1977). The function of job analysis in content validation. Personnel Psychol- 
ogy, 30, 1977, 167-173. 

Rajaratnam, N. (1960). Reliability formulas for independent decision data when reliability 
data are matched. Psychometrika, 25, 261-271. 

Rajaratnam, N., Cronbach, L. 3., and Gleser, G. C. (1963). Generalizability of stratified 
parallel tests. Psychometrika, 30, 39-56 

. Ree, M. J.. and Jensen, H. E. (1980). Effects of sample size on linear equating of item 
characteristic curve parameters..In D. J. Weiss (Ed.). Proceedings of the 1979 computer- 
ized adaptive testing conference, Minneapolis: University of Minnesota, Department of 
Psychology, Psychometric Methods Program, Computerized Adaptive Testing Laboratory. 

Rentz, R. R., and Bashaw, W. L. (1977). The national reference scale for reading: An 
application of the Rasch model. Journal of Educational Measurement, 14. 16١-180 

Roid, G.. and Haladyna, T. (£980). The emergence of an item writing technology. Review of 
Educational Research, 50, 293-314. 

Roth, A. V., and Lubin, B. (1981). Factors underlying the depression adjective check lists. 
Educational and Psychological Measurement, 4], 382-85 

Rovinelli, R. L. and Hambleton, R. K. (1977). On the use of content specialists in the 
assessment of criterion-referenced test item validity. Durch Journal of Educational Re- 
search, 2, 49-60. 

Rowley. G. L., and Traub, R. E. (1977). Formula scoring, number-right scoring, and test- 
taking strategy. Journal of Educational Measurement, 14, 1522. 

Rozeboom, W. W. (1981). The cross vatidational accuracy of sample regressions. Journal of 
Educational Statistics, 6, 179-198. 

Rudner, L. M. (1977). An approach to biased item identification using latent trait measure- 
ment theory. Paper presented at the annual meeting of the American Educational Research 
Association, New York. 

Rudner, L. M., Getson, P. R.. and Knight, D. L. (1980). A Monte Cario comparison of 
seven biased item detection techniques. Journal of Educational Measurement. 17, 1-10. 

Rulon, P. J. (1939). A simplified procedure for determining the reliability of a test by 
split-halves, Harvard Educational Review, 9, 99-103. 

Saunders, J. C., Ryan, J. P., and Hunvh, H. (1981). A comparison of two approaches to 
standard setting based on the Nedelsky procedure. Applied Psychological Measurement, 5, 
209-218 f 

Saupe. J. L. (1966). Selecting items to measure change. Journal of Educational Measure- 
ment, 3. 223—226. i 

Sawyer, R. L., Cole, N. §.. and Cole. J. W. L. (1976). Utilities and the issue of fairness in 
a decision theoretic model for selection, Journal af Educational Measurement, 13. 59—76. 














Sax, G. (1980). Principles of educational and psychological measurement and evaluntion 
(2nd Ed.}. Belmont. Cafif.: Wadsworth. 

scheuneman, J. (1979). A new method for assessing bias in test items. Journal of Educa- 
tional Measurement, 16, 143-152. ١ 

Schmidt, F. L., and Hunter, J. E. (1981). Employment testing: ‘Old theories and new research 
findings, Äineritan Psychologist, 36, 1,128-1,137. ۱ 

Schmidt, F. L., Hunter, J. E., and Urry, V. W. (1976). Statistical power in criterion-related 
validity studies. Journal of Applied Psychology, 61, ۸73-485. 

Schmitt, N. (1978). Path analysis of multitrait-multimethod matrices. Applied Psychological 
Measurement, 2, 187-174. 

56۲1۷88: M. (1978). How to anchor standards, Journal of Educational Measurement, 15, 
273-275. 

Shavelson, R. J. (1981). Statistical reasoning for the behavioral sciences. Boston: Allyn and 
Bacon, : 

Shavelson, R. J., and Bolus, R. (1982). Self- -concept: The interplay of theory and methods. 
Journal of Educational Psychology, 74, 3-17. 

Shepard, L. A. (1976). Setting standards and living with them. Florida Journal of Educa- 
tional Research, 18, 23-32. 

Shepard, L. A. (1979). Setting standards, In M. A. Bunda and J. R. Sanders {Eds.). Prac- 
tices and problems in competency-based measurement. National Councit of Measurement 
in Education. 

Shepard L. (1980). Standard setting issues and methods. Applied Psychological Measure- 
ment, 4, 447-465, 

Shepard. L., Camilli, G., and Averill, M. (1981), Comparison of procedures for EERE 
test item bias with both internal and extemal ability criterion. Journal of Educational 
Statistics. 6, 317-376. 

Shoemaker, D. M. (1975). Toward a framework for achievement testing. Review of Educa- 
tional Research, 45, 127-148. 

Sirotnik. K. (1972). Estimates of coefficient alpha for finite poputations of items. Educa. 
tional and Psychological Measurement, 32, 129-136. 

Stakter, M. J. (1968). The penalty for not guessing. Journal of Educational Measurement, 5. 
141-۰ 
Stakter, M. 1.) ۰ Generality of risk taking on objective examinations. Educational and 
Psychological Measurement. 29, 125-28 

Slinde, J. A., and Linn, R. L. (1978). An exploration of the adequacy of the Rasch model for 
vertical equating. Journal of Educational Measurement, 15,.23-35. 

Slinde, J. A.. and Linn. R. L. (1979). The Rasch model, objective measurement, equating, 
and robustness. Applied Psychological Measurement, 3, 437-456. 

Spearman, C. (1904). The proof and measurement of association between two things. Amert- 
can Journal of Psychology, 15, 72-10 

Spearman, C. (1907), Demonstration of formulae for true measurement of correlation. Amer- 
ican Journal of Psychology, 18, 161-169. 

Spearman, C. (1913), Correlations of sums and differences. British Journal of Psychology. 
5, 457-426. 

Stanley, J. C. (1974). Reliability, In R. L. Thorndike (Ed.), Educational measurement )2 
Ed.). (pp. 359-442). Washington, D.C.: American Council on Education. 

Stevens, S. S. (1946), On the theory of scales of measurement. Science, 103, 677-680. 

Subkoviak, M. J. (1976). Estimating reliability from a single administration of a criterion- 
referenced test. Journal af Educational Measurement, 13, 265-275, 


= 9 



































Subkoviak, M. J. (1978). Empirical investigation of procedures for estimating reliability for 
mastery tests. Journal of Educational Measurement, 15, ۱۱۱۰, 

Subkoviak; M. J. (1980). Decision consistency approaches. In R. A. Berk (Ed.). Criterion- 
referenced measurement: The state of the art. Baltimore: Johns Hopkins University 
Press. 34 

Swaminathan, H. (1983). Parameter estimation in item response models. In R. K. Hambleton 
(Ed.). Applications of item response theory. Vancouver: Educational Research Institute of 
British Coluinbia. : 

Swaminathan, H., and Gifford, }. (1979). Estimation of parameters in latent trait models. In 
D. Weiss (Ed.). Proceedings of the 1979 computerized adaptive testing conference. Min- 
neapolis: University of Minnesota. 

Swaminathan, H., Hambleton, R. K., and Algina, J. (1974). Reliability of criterion refer- 
enced tests: A decision theoretic formulation. Journal of Educational Measurement, 11, 
263—268. . 

Tallmadge, G. K., and Wood, C. T. (1976). User's guide: ESEA Title I evaluation and 
reporting system. Mountain View, Calif.: RMC Research Corp. 

Taylor, H. C., and Russell, J. F. (1939). The relationship of validity coefficients to the 
practical effectiveness of tests in selection: Discussion and tables. Journal of Applied 
Psychology, 23, 565-578 

Tenopyr, M. L. (1977). Content-construct confusion. Personnel Psychology, 30, 47-54 

Thissen, D. M. (1976). Information in wrong responses to the Raven Progressive Matrices. 
Journal of Educational Measurement, 13 (3), 201-214. 

Thorndike, E. L. (1904). Aa introduction to the theory of mental and social measurements. 
New York: Science Press. 

Thorndike, R. L. (1949), Personnel selection. New York: John Wiley. 

Thorndike. R. L. (1971). Concepts of culture fairness. Journal of Educational Measurement, 
8, 63—70. : 

Thorndike, R. L. (1975). Mr. Binet's test 70 years later. Educational Researcher, 4(5), 3-7. 

Thorndike, R. L., (1982). Applied psychometrics, Boston: Houghton ۰ 

Thorndike, R. t., and Hagen, E. (1977). Measurement and evaluation in psychology and 
education. New York: John Wiley. 


Thurstone, L. L. (1927). A law of comparative judgment. Psychological Review, 34, 273- 
286. ۱ 


Thurstone, L. L. (1928). Auitudes can be measured. American Journal of Sociology, 33. 
529-554. 1 ١ 

Thurstone, L. L. (1942). Multiple factor analysis. Chicago: University of Chicago Press. 

Thurstone, L. L.. and Chave, E. J. (1929). The measurement of atitude. Chicago: University 
of Chicago Press. 

Torgerson. W. S, (1958). Theory and methods of scaling. New York: John Wiley. 

Traub, R. E., and Hambleton, R. K. (1972). The effect of scoring instructions and degree of 
speededness on the validity and reliability of multiple-choice tests. Educational anid Psy- 
chological Measurement, 32, 737~758. 

Traub, R. E., and Rowley, G. L. (1980). Reliability of test scores and decisions. Applied 
Psychological Measurement, 4, 5١7-546 

Traub, R. E., and Wolfe, R. G. (1981). Latent trait theories and assessment of educational 
achievement jin D. C., Berliner (Ed.). Review of research in education 9. Washington, 
D.C.: American Educational Kesearch Association. 


Travers, R. ML (1951), Rational hypotheses in the construction of tests. Educational and 
Psychological Measurement, £1, 1282-7 











Tucker, L. R. (1946). Maximum validity ‘of a test with equivalent tems. Psychometrika, 11 
1-43. 

Udinsky, B. F., Osterlind, S. J., and Lynch, S. W. (1981). Evaluation resource handbook: 
Gathering, analyzing, reporting data, San Diego, Calif.: EDITS. 

van der Linden, Wim J. (1982). A latent trait method for determining intrajudge inconsis- 
tency in the Angoff and Nedelsky techniques of standard- seting. Journal of Educational 
Measurement, 19, 295—380. f 

van der Linden, W. J., and Mellenbergh, G. J. (1977). Optimal cutting scores using a linear 
loss function. Applied Psychological Measurement, 1, 593-599. 

van der Linden, W. J., and Mellenbergh, G. J. (1978). Coefficients for tests from a decision 
theoretic point of view. Applied Psychological Measurement, 2, 119-134. 

van der Ven, A. H. G. S. (1980). Introduction to scaling. New York: John Wiley. 

Velicer, W. F., and Stevenson, J. F. (1978). The relation between item format and the 
structure of the Eysenck Personality Inventory. Applied Psychological Measurement, 2, 
293—304. . 

Wainer, H., Morgan, A., and Gustafsson, J. E. (1980). A review of estimation procedures 
for the Rasch model with an eye toward longish tests, Journal of Educational Statistics, 5, 
35-64. 

Ward, W. C., Carlson, S. B., and Woisetschlager, E. (1983). IH- ا‎ problems as 
multiple-choice items. (GRE Board Professional Report No. ots 18P). Princeton, N.J.: 
Educational Testing Service. 

Ward, W. C., Frederiksen, N., and Carlson, S. B. (£980). Construct validity of free-response 
and machine-scorable forms of a test. Journal of Educational Measurement, 17, 11-29 

Ware, W. B., and Benson, J. (1975). Appropriate statistics and measurement scales. Science 
Education, 59 (4), 575—582. 

Weber, E. H. (1846). The sense of touch and common feeling. In W. Dennis (Ed). Readings 
in the history of psychology. New York: Appleton-Century-Crofts, 1948. 

Wechsler, D. (1939). The measurement of adult intelligence. Baltimore: Williams and Wil- 
kins. 

Wechsler, S. W. (1958). The measurement and appraisal of adult intelligence (4th Ed.). 
Baltimore: Williams and Wilkins. 

Weitzenhoffer, A. M. (1951). Mathematical structures and psychological measurement. 
Psychometrika, 16, 387-406. 

Whitely, S. E., and Dawis, R. V, (1974). The nature of objectivity with the Rasch model. 
Journal of Educational Measurement, 11, 163-178. 

Wilcox, R. R. (1976). A note on the length and passing score of a mastery test, Journal of 
Educational Statistics, 1, 359-364. 

Wilcox, R. R. (1977a). Estimating the likelihood of false positive and false negative deci- 
sions 0 mastery decisions: An empirical Bayes approach. Journal of Educational Statis- 
tics, 2, 289-307. 

Wilcox, 3 R. (1977b). New methods for studying equivalence, In C. W. Harris, A. P. 
Pearlman, and R. R. Wilcox (Eds.). Achievement rest items——New methods of study. Los 
Angeles: Center for the Study of Evaluation, University of California. 

Wilcox, R. R. (1978). A note on decision theoretic coefficients for tests. Applied Psychologi- 
cal Measurement, 2, 609-613. ۲ 

Wilcox, R. R. )۱98۱۵(۰ A closed sequential procedure for answer-until-correct tests. Journal 
of Experimental Education, $, 219—222. 

Wilcox, R. R, 198}b). A cautionary note on estimating the reliability of a mastery test with 
the beta-binomial model, Applied Psychological Measurement, 5, 531-537. 








== 651 






































652 


Wilcox, R. R. (1981c). Solving measurement problems with an answer-until-correct proce- 
dure. Applied Psychological Measurement, 5, 399-414. 

Wilcox, R. R. (1982). Some new results on an answer- -until- correct procedure. Journal of 
Educational Measurement, 19, 67-74. 

Wood, R. L., Wingersky, M. S., and Lord, F. M. (1976). LOGIST-A computer program for 
estimating examinee ability and item characteristic curve parameters. (Research Memoran- 
dum 76-6). Princeton, N.J.; Educational. Testing Service. 

Wright, B. D. (1968). Sample free test calibration and person measurement. In Proceedings 
of the 1967 Invitational Conference on Testing Problems. Princeton, N.J.: Educational 
Testing Service. 

Wright, B. D., and Douglas, G. A. (1977). Conditional versus unconditional procedures for 
sample-free item analysis. Educational and Psychological Measurement, 37, 47-60. 


AWright, B. D., Mead, R., and Bell, S. (1979). BICAL: Calibrating items with the Rasch . 


model. (Statistical Laboratory Deparment of Education RM 23b). Chicago: University of 
Chicago. 

Wright, B. D., and Panchapakesan, N. (1969). A procedure for sample free item E 
Educational and Psychological Measurement, 29, 23-48. 

Wright, B. D., and Stone, M. (979). Best test design. Chicago: MESA Press. 

Wundt, W. (1873). Principles of physiological psychology. In W. Dennis (Ed.). Readings in 
the history of psychology. New York: Appleton-Century-Crofis, 1948. 

Yalow, E. S., and Popham, W. J. (1983). Content validity at the crossroads. Educational 
Researcher, 12(8), 10-14, ش‎ 

Yerkes, R. M. (1921). Psychological examining in the United States Army. In W. Dennis 
(Ed.). Readings in the history of psychology. New York: Appleton-Century-Crofts, 1948. 

Zieky, M. J.. and Livingston, S. A, (1977). Manual for setting standards on the Basic Skills 

. Assessment Tests. Princeton, N.J.: Educational Testing Service, 

Zimmerman, D. W., and Williams. R. H. (1982). Gain scores in research can be highly 
reliable. Journal of Educational Measurement, 19, 149-154, 





036 æ "e s ايع لمم‎ mae p anamannan, بدي‎ Aeneane e عع ل‎ o 


(i) الملحق‎ 


Probabilities and Y Ordinates Associated with given z-Score under the 
Standard Normal Curve 


Y ordinate 


3989 
3984 
3970 
3945 
3910 
3867 
-3814 
2752 
3683 
3605 
3521 
3429 
3332 
.3230 
3123 
3011 
2897 
2780 
2661 
254 

2420 
2299 
2179 
2059 
1942 
1827 
1۳1۳ 
1604 
1497 
1394 
1295 
4200 
1109 
1023 
0941 

0863 
.0790 
-0721 

0656 
0596 
0540 
0488 


a a arent a ef سحب‎ amanan yasna 





Pr عه‎ ~z Pr ع‎ +2 
.500 .500 
480 .520 
. 460 .540 
.440 -560 
424 579 
408 .599 
.382 -618 
363 537 
.344 656 
.326 674 
.309 691 
29] . 109 
.274 .726 
258 742 
.242 .758 
-227 -773 
-242 . 788 
.198 . 802 
.184 816 
71 .829 
.159 .841 
147 -853 
.136 864 
123 875 
۱15 .885 
-106 894 
,097 -903 
089 911 
001 -919 
-074 .926 
.067 .933 
6۱ 939 
O55 945 
-049 OSE 
O45 955 
040 960 
2036 964 
.032 . 968 
.029 971 
.026 O74 
023 977 
.020 -980 
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تابع ملحق (1) 





Absolute Vatue 





of 2-Score ` Presi ~z Prs tz Y ordinate 
2.10 18 -982 0446 
2.45 016 .984 0396 
2.20 O14 986 0355 
2.25 .012 988 317 
2.30 OL -989 .0283 
2.35 9 991 .0252 
2.46 .008 992 .0224 
2.45 .007 993 0198 
2.50 006 994 -0175 
2.55 .005 995 .0155 
2.60 005 995 0136 
2.63 -004 .996 10 
2.70 003 .997 .0104 
2.75 .003. -997 -0091 
2.80 -003 -997 .Q079 
2.85 002 998 . 0069 
2.90 002 -998 0060 
2.95 O02 -998 -0051 
3.00 .001 -999 .0044 
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الملحق ( ب ) 
مفاتیح إجابة الأسئلة 
الفصل الأول 


1- اختبار 

ب- قیأس 

ج- لا توجد طريقة معيارية لجمع البيانات لذا فإنه لا يعد قياس أى اختبار. 
د- اختبار ومقياس 

ه- اختبار 

و- قياس 

aig 

ب- قیاس Lah‏ املاحظ 

ج- قياس الأداء النمونجي 

د- قياس آقصی آداء 

1- المشكلة الرئيسية هي تحدید بناء الطلاقة وتحدید طريقة القیاس. فقد عرف 


الباحون البناء إجرائياً بطريقة تختلف عن الطريقة التی اختارها هذا 
الباحث. 

2- أخطاء العاينة تعد المشكلة الرئيسية للتعميم من أداء العينة من الفقرات 
المستخدمة إلى مجال أكبر من النطاق. فعند استخدام عينة أخرى من 
الفقرات فقد تختلف درجات التلاميذ. 

3- بالإضافة إلى أخطاء التلاميذ فى بعض الواقف التى قد لا تظهر ثانية عند 
إعادة الاختبار. 

5- إعطاء الدرجات النهائية على الاختبار لها less We‏ ما بسلوكات أخرى 
تمثل الطلاقة التي قد تكون مهمة. 
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4/ أ - بينية 
ب“ فوندت وويبر 
ج- جالتون 
5/ أ- تصميم بحث 
ب- تطویر آداه. 
ج- تحلیل إحصائي استدلالي 


ی 
6/ یا EE AE‏ 
الفصل الثاني 
A‏ - الجموعة د 


ب- الجموعة الثانية / الجموعة الأولى 
ج- الجموعة الأولی 
د- الجموعة الثانية والتي لها منحنی توزیع ملتو قليلاً. 
of. 1378= 0, 25= py 2‏ 1.70 
۱ © 1.90 (استخدمت N‏ في القام في حساب الانحراف العياري والتباین). 


ملا 26 =1.703 و 1.70 
۳ - 2.89 

1.67 نو‎ 1.679 =0 25 = ty 
2.79 = Oy 
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الدرجة الزائية 








۸ أ- لكل 2 = صفرء الدرجة الخام هي متوسط JS‏ مجموعة 
4 
ب- لكل 2 = l-‏ تحسب من المعادلة ZX =Z‏ 
r 25 -x :‏ 
للمجموعة الأولى - 1.00 = 1 
1.38 
x‏ = 23.62 = 24 
5/ لا. لأن تباین اللجموعة ۳ آکبر لكل درجة زائية أكبر من صفر تکون الدزرجات 
6/ [- 1.6 % درجاتهم آقل من ریبیکا. 
و 1 0 درجاتهم بين رونالد وشارون. 
د- درجة شیلدون لانهما الأقرب من وسط التوزیم. 








4 لا. لأن الدرجات توزیعها لیس طبيعياً. 
8/ سه =Z,‏ 30-55 = 5 
10 
=z‏ 20-49 = -5 الساحة تحت النحنی بان 2 و Zy‏ 
10 


= 0.691 - 0.309 و 0.382 
ب- سؤال مکافی: ما نسبة المفحوصين التي تقع درجاتهم بين 45 و 50. 


0.097 =p 10 
007 
0.42 - 2م‎ 
0.94 = pè 
0.18 = py, 


1 الاعلاقة بين متغيرين اثنين تشير إلى أن أي منهما يكون سبباً لحدوث الآخر. 
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(Zy) (0, = 2y, 


0.32- = (0.75-) (0.42) = zy, 
20-y\ Sh at _ 
762 oy ` ف‎ 


هه ۷ = 17.56 
الاختلاف في حجوم العينات قد يكون المؤدي p!‏ الاستنتاجات الختلفة, والخطاً 





7 - ۷ 
Ye نعم‎ 


-IX =] P9 - 10y = 0, ,‏ )0.63( 2.33 بنسبة نقة 95 6 بآن درجات 


الاختبار البعدي ل X‏ = 15 تقع في النطقة: 
)15 - 1.96 )2.33)( ی )15 + 1.96 (2.33)) أو بين )10.43( و )19.75( 
byx‏ = 0.63 )4( = 0.38 للمفحوصي الأول الذي يبعد نقطة عن X‏ 
x 5‏ 0.38 = 1.9 للمفحوص الذي san‏ خمس نقاط عن X‏ 
الیل ae byx‏ = 0.63 سج = 0038 
القاطع € = by.x - M,‏ ) 
= 36 - 0.38 )20( = 28.4 
[- الوسطت 5 )10( = 50 
ب- الدرجة المنحرفة لكل مفحوص ستكون خمسة أضعاف 
ج- التباين سيكون 5 × 92 = 255 نقطة. 
ا 
aes Ke 7 o”?‏ 
(Ha XK) =‏ ‘ 
N‏ 
J3 k? 1‏ ند - ,1( 2 


0 xk? 








الفصل الثالت 
/\ أ- تحويل خطي ل = 2 ×+ 1 تدريج رتبي 


ج- متوي. 
Ges Tal 37‏ چ4 د-2 
ب- الأفراد 2 7 8 10 


ج- 3:1 ,4:5 ,6:9 
دس لر5 يستجيب ل ب 
ر5 يستجيب لب آو > 
S‏ يستجيب لآ 
So‏ يستجيب لب أو أ 
يبدو أن ب هي المشكلةء فعلى مطور الاختبار أن يتساءل عما إذا كانت ب تقيس البعد الذي 


تقيسه الفقرات الأخرى. 
فد 5€ تت 


© -1 سک = 0.1-1 = 0.90 هذا التدريج يحقق تدريج جوتمان. 


و- من الصعوية بمكان وعملياً تطوير تدريج لعدد كبير من الفقرات بمثل هذه الطريقة. 


3  ةقطنم‎ sigo 
5 ج بد منطقة‎ 
6 منطقة‎ fuse 
E SEE 
7  ةقطنم‎ lugs 
4  ةقطنم ب جد‎ 


== 659 






































5 أ متمركز حول المثير 
ب- متمركز حول الفرد 
ج- متمركز حول الاستجابة. 


الفصل الرابع 


1/ 
توزیع المعالم. توزیع طبيعي ارتباط / انحدار 


CEREN 






8 30 % 
%35 %15 %50 
- %10 %30 60 % 
ب- 9035 50 % 
ج- 30 % 


-f 4‏ يتغير كل من درجة حرارة وضغط الغاز. 
ب- أن يخبر التلاميذ بعضهم البعض عن كيفية حل المسالةء وهنا فإنها لا تقيس 
مستوى التطبيق . 


5 ا استخدام " سبب". 


" ب- استخدام " إذا ...... فإن". 
ج- هذه أساساً حقيقة, لذا من الأفضل استخدام نمط صح thd‏ بدلاً من نمط 
تند oy‏ 


د- استخدام YW"‏ 
ه- طويلة Jas‏ اللفظ معقد جداً. استخدم لفظ " أحياناً". 
6 من الطرائق المكنة استخدام Bal‏ التلمپذ نفسه في تحلیل الحتوی والحاضرة 


ده 











Gls GEG ol aN SS)‏ اذل حدرض ماش 


الفصل الخامس 

fl‏ رل =7 ,ر6 -1.14 (وحسبت باستخدام قيمة × في المقام). 

فلات 6 , و6 =190 

1.36 ,و6‎ 6.6 =p, 

097 هد 0 202 هد‎ 62 4-u 

2 أ الفقرة 1 ,و = 0.90 وهي الفقرة الأسهل. 
ب“ فقرة 3 pg‏ = 0.25 
ج- 0.50 
د- 0.36 
~a‏ 0.22 
و- 0.05 


7.68 12.15 9.00 -i /3 
18.00 25.00 
16.00 


ب- 125.66 
4/ النتيجة ليست منطقية, لأنه مع إمكانية تحقيق التباين الأساسی فإن جدوى أو 
معنى الدرجات سينخفض وذلك للتقييد الشديد للمجال السلوكي الذي يمثله 
الاختبان. 
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/2 
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/3 


/4 


/6 


/7 
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الفصل السادس 

E 

ب . عشوائي 

ج- منتظم 

د- عشوائي 

ه- عشوائي 

(5 Jaa O 

وه 025 0 125 ود 050 . 

لا یمکن, وذلك لأن الدرجات الحقيقية الفعلية ودرجات الخطأ غير معروفة. لذا 
فان تباین كل منهما لا یمکن حسابه مباشترة. 
لا. مع أن 15(8) = صفر لكل مفحوص عبر عدد كبير لا نهائي من الاختبارات» 
ومن غير القبول أن تساوي صفر لثلاثة قیاسات متكررة فقط. 

لا یکون لجون آکثر من درجة حقيقية واحدةء ونظرياً پوجد درجة Lada‏ مختلفة 
لکلا الاختبارین. 
ب.مع ان Ge‏ لایمکن حسابها مباشرة من اللاحظات التجريبية. و ,6 
يمكن حسابها مپاشرة من قیاسات في 1 و J‏ على الأفراد آنفسهم. 
+O, P1,‏ يوم Oy"‏ +2 ورم ,0 ره 


=p ۱ 
0,0; 02 p, 2 +O, +O, yy 


0.55 -[ 

پ- 20.93 
ج- 275.97 ( 6۶ O7‏ + وه +2 رم 0,0 6) 
د- 0.97 ( الحل باستخدام الصيغة البنية في تمرین (T‏ 


,4% را + =X,‏ رل 
ور +O‏ پر © + جو © غير tO‏ © + وو 6 
بر + ,6 








و- 19.9 إلى 24.1 
ز- دائري ( لا علاقة). 


/1 


/2 


/3 


الفصل السابع 
اكد ساق دا ينعن اا RR‏ 
ب- صيغة بديلة أو مكافئة. 
‘Gif ise‏ 
E‏ والقلى Kas).‏ افوا دی 
هب الاختبار ب الاعادظ باستخدام الصنيقة Glad! ( WUC‏ وتکافو). 


4, 1, 4, 2, 3, 4, 2, 1, 2,3 فردي‎ -i 

ب- زوجي 2,3 ,1,2 ,4 ,2 ,3 ,3 ,31 

ج- 0.74 حسب التباين باستخدام + في القام 

ه آقل ۰ 

و- يفضل استخدام التجزئة الفردية- الزوجية. 

فأول تجزئة يبدو أنها تعطي AST‏ مجموعة متشابهة من الدرجات المکن 
الحصول عليها من التجزئات الممكنة جميعها. لذا فان الحساب العتمد على هذه 
التجزكة لا يكون قريب جدا من معامل آلفا ( أي الحد الأدنى لمعامل الدقة). 

رس 0.63 , 0.55 ش 

ط- الفقرات لیست متساوية في صعوبتها. 

3.1: ومن ب‎ 3.3 fgat 


لاء يجب أن یخن بعين الاعتبار حجم الخطأ المعياري للقياس بالنسبة للانحراف 
المعياري. 


SS اپ‎ 


26.6 - 4 
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27.6 , 4 a 


0.83 ~s 
ه- يجعلها قيمة مغالى فيها للقيمة المحسوية فيما لو أكمل الطلبة الاختبار.‎ 
0.58 , 0.40 و-‎ 

4 1 معامل إعادة الاختبار بعد يوم واحد )0.95 ,0.87 ,0.91 ,0.89). 
ب- 0.85 , 0.89 
ج- 0.86 , 0.80 , 0.83 , 0.78 
د- 0.70 , 0.68 


هم كانت معاملات الإعادة بعد أسبوع لحساب معاملات التکافق. 


الفصل الثامن 


0.926 = ۵2-1 /1 
Ge” + nO,” 8 ! 
0.09 + 15 = — t5 
n 


i À 2‏ 
b= -g‏ = 0.862 
2 م = 0.355 إذا كان للمفحوصين فرص تفضيل متماثلة. فإن الدرجة على أي 
فقرة (Sas‏ تعميمها إلى درجة النطاق. علاوة على أن التعميم يظهر حتى عندما 
تطبق فقرات مختلفة على مفحوصين مختلفين. 
—i /3‏ )1( الفقرات 
(ب) بعد الفقرات من الممكن أن يكون عشوائياًء وعادة يرغب الفاحصين 
بالتعميم إلى مجموعات أكبر من تلك التي في الاختبار. 
(ج) تباين درجة النطاق or‏ » تباين الدرجة الملاحظة المتوقع/ را 
2 2=6 6 
62,MS-MS. °‏ 
Gs)‏ سا ee‏ 
1 
ب- )1( البطاقات ‏ (1) السیکولوجیین (1). 





MS = 
r 


س 664 

















(ب) على الأغلب أن كلا من البطاقات والسيكولوجيين غير ثابت. 
(z)‏ تباين درجة النطاق "م0 » تباين الدرجة الملاحظة المتوقع: 





2 
Oe" — + nj\/ opj? + ni\/ op}? 
nÀ nù 
MS_- MSs. 
r Pj 2. 
STO Py 
nı 
MS -MS 
r pJ 42 
Taree ا‎ Op 
n 
1 
MS - 2 
و‎ e 


)1( النماذج (I)‏ والوضوعات (J)‏ 
(ب) النماذج ثابتة. 

(ج) تباین درجة النطاق Op + Op?‏ / ام 
تباین الدرجة اللاحظة التوقم: 


min /6 + 6 2+6 2+ 2ى‎ 
[1 € pj 1 pi p 


9 . - MS 
M pi ع‎ 8 2 
ny i, P 

-MS . 
MS, M, pi _ é 2 
n, pi 


£ ۸ ۸ 
MS - 62+ ى‎ 2 
۱ r e pJ 

د- () الفقرات (I)‏ والتلاميذ (J)‏ 

(ب) يمكن أن يكون كلاهما عشوائي. 

(ج) تباين درجة النطاق ,0 وتباين الدرجة الملاحظة المتوقع: 

2 2 2 2 2 2 
(CG. +O + nj (C; +0 yet O gro 5 
MS + Ms. - MS .- MS 

0 Jip pl P 


nn. P 
ji 








== 665 


























1 
8 
N 
+ 
Q 
N 
3 





S 2 
p 
6746 246 2462 
e Yp pe وكا‎ 
27.729 
1.261 + 41.732 + 0.015 + 27.729 


0.392 = 


A 
هي أكبر عنصر في‎ ae OY ب- زيادة عدد الحوادث ( المواقف الملاحظة) وذلك‎ 
تباين الخطأ لتباين الدرجة الملاحظة.‎ 


3 أثنان متدأخلة وتصميم‎ Lasse ملاحظین. وحوادث‎ GMs, 1 تصميم‎ ar ch 
بثلاثة حوادث وثلاثة ملاحظين يعد تصميماً عملياً. واكبر معامل تعميم ينتج‎ 


2/02 + فى‎ 
| pj vp 


| 
D> 


A A A = 
n\n\/ O+n./6 24+n./6.4+62\ 
13 J P} J pJ p 


3/41.732 + 27.729 
6/10261 + 3/ 41.732 + 2/ 0.15 + 27.729 
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/3 


a 


الفصل التاسع 


0.029 -1 

ب- 1.69 

ج- 0.036 

0.39 -[ 

EN ou‏ مخ toads‏ إلى متوسطة. 


0.88 075 036 + 


MS. - MS. 
MOP Ags 
KR20 و-‎ 
0.80 060 لدرجة القطع‎ - 1 
053 0.70 لدرچة القطم‎ 
067 0.80  عطقلا لدرجة‎ 
097 0.90  عطقلا لدرجة‎ 


ب- 0.29 ,0.08 ,0.21 ., 0.42 
= 0.60 ,0.07 .0.33 ,0.73 

ه- 0.58 

؟- 0.57 ( لدرجة القطم 0.50( 

ب- نظرياً 14 ( © ) يجب أن تكون أقل. 

ج- 0.57 لدرجة القطع 0.50 

د- هي آکثر من معامل لدقة الاتساق. 

ه- قيمة العامل يعتمد على قيمة تباین درجات النطاق 








=== 7 
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0.21 -4 

[- تباين الدرجات قلیل نسبياً. 

ب- یمکن تحسینه. 

ج- يمكن تقلیله لأن “رم يمكن خفضها. 
د- قيم Pt‏ و kK‏ أقل من Pind‏ 

ه- أقل days‏ قطع. 


الفصل العاشر 


Glad des‏ اهنا ونسبه السكراف لش bits Guns‏ بر یی ات 
الأهمية وعدد الفقرات التی تقیسها. نسبة الاهداف التي لم تغطی بفقرات هذا 
الاختبار. 





ب- الفقرات التي تقیس الهدف تحتها خط في بند أ. 

ج- ینخفض العامل لأن الفقرة حکم على آنها تقیس هدفین بصورة مناسبة. 
كلما أصبح الاختبار آکثر تجانساء فمن غير الحتمل أن یتضمن فقرات محتوی 
وینتج عن ذلك نسبة آقل. 
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/7 
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[- يقال التباين ( يختزله). 

ب- المستخدمين في الوظيفة قد لا يمثلوا مجتمع المتقدمين للوظيفة . 

ج- تلوث المحك. 

د- لم تجري دراسة صدق مباشرة لدرجات الاختبار مقابل المحك الذي نهتم به. 

[- صدق الیناء 

ب- الصدق الرتبط بمحك تنبؤي. 

ج- صدق محتوی. 

د- الصدق الرتبط بمحك تلازمي. 

ه- صدق مرتبط بمحك تنبي» ومن الممكن صدق بناء. 

0.66, 0.73, 0.64, 0.70 لجوردن‎ -i 
0.80 , 0.73 , 0.79 , 0.80 لبيرهاريس‎ 

ب- 0.78 , 0.59 , 0.55 , 0.80 

ج- المظهر الفيزيائي والملائمة الأكاديمية. 

د- الارتباط بين الملائمة الشخصية والمظهر الفيزيائي كما تقاس بالطريقة أء 
وبين الملائمة الأكاديمية والمظهر الفيزيائي كما تقاس بالطريقة ب. 

ه- الارتياط بين الملائمة الأكاديمية بالطريقة ب» والاجتماعية بالطريقة [. 

1.00 , 0.75 , 0.83 , 0 


للمساعدة في الاشتقاق: Say‏ تعظيم Pi‏ عندما تكون Pi,‏ = 1.00 

تحديداًء معامل الصدق لا يجب أن يتجاوز مريع الجذر التربيعي لمعاملات 
ات انس ahaa‏ ال الثيات او الحامل هنيما كين قدت 
اقل من 1.00. , : 


2 7 
Poa Py .‏ ج > (افرض أن ثبات الحك = 1( حسیث أن Py‏ أقل 


۸ A 
(ie - 1( ابي‎ 
معامل صدق مرغوب.‎ 


== 9 



































۸ 
٥ ۳‏ تقدير الثبات لجموعة الفقرات الاولية فى الدراسة. ولا يوجد ضمان بأن 
زيادة طول الاختبار سيزيد من الصدق إلى الستوی الطلوب. 





الفصل الحادي عشر 


1/ هو الارتباط بين GPA‏ و MRA‏ للطلبة المتجانسين فى الهارات الأكاديمية. 
2 _ 2 س 
wy, 0.50 = R: ۴ 12‏ “1 0.02 
p2‏ 2 
ول Roy 0.70 =R‏ = 0.30 
كان معامل الارتباط للمجتمع أساسيء وبالطبع 0.85 أو أعلى. وعدا ذلك وللحصول على 
~i /3‏ ابوع 84.6 + 3.4 (D. 48) 2.2 + (CFIT)‏ 
بت y\‏ = 218.6 
A ۳‏ 
ج- O Y.X,.X,‏ = 24.7 
-s‏ 175.9 , 3 , 261 
ه - لاء حجم العينة كبير نسبياً. 


-i /1‏ متوسط لآ للمجموعتين هو 6.59 , 8.33 على التوالى. ومتوسط الوسط 
4 يصنف أي مريض درجته y‏ = 7.46 أو أعلى منها على أنه شارب 


د- حيث أن القانون طبق على المرضى الذين طور القانون من خلالهم» فان دقة 
E‏ كو تا مركت 























الفصل الثاني عشر 





1 1 الاحتمالية المتكافئة ۸ : a‏ = 0.75 لكل من الذکور والإناث. 
النسبة الثابتة: vi‏ 114 4 057 للاناف (ste GEN aL‏ 
الاحتمالية الشروطة: = 0.86 للذکور و 043 للاناث ( طريقة الاختیار 
متحيزة). 

الانحدار © = -1.873 للذكور. 

b‏ = 0.055 للذكور. 

© = - 2.058 لااتات 

5 = 0.061 للاناث (طريقة الاختيان متحیزة). 


ی =Xe‏ 092 ذگور = 0.43 





] + 4 





D+A 





0.43 = سف‎ sit. 0.82 = Xe 

SEINE للذكور و‎ 70 = Xe 
د- لا پوجد نقطة قطع مفردة على الاختبار تتجاون 70 من الذكور و 9670 من الإناث.‎ 
وق از‎ Steg وال شوت‎ a المح ال‎ A 
للمجموعة الرئيسية.‎ 0.80 =E (u) 43 

E (u),‏ = 0.625 للمجموعة الفرعية. 

E(u) ,‏ = 1.125 للمجموعة الفرعية. 

E(u)‏ = 0.625 لذا يتم اختيار كلا الجموعتین 





== 1 
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الفصل التالت عشر 


اس =2 “us‏ 0.2910 
د- 0.378 ه 0.435 و 0.357 


hp -p= زد‎ 


اللغة الاسکتلندية 0263 


اللغة الانجليزية 0342 
التاریخ 0393 


لاء کل متغیر له تباین درجات حقيقي أساسي غير مرتبط بالعوامل AS LGN‏ 
A ۶ | . A‏ ۸ 5 ۸ 

ح- هل رم تساوي تقریباً ربة + ,3 + بر ربة لجميع قيم Py‏ 
معرفة تشبع العامل لحلول العوامل 3 , 4 , 5 لرؤية ما إذا كان لها تفسيراً 
منطقياً. علاوة على استنخدام تدوير العوامل الذي يجب أن يؤخذ بعين 
الاعتبار. ~ 

الفقرات من 28 إلى 37 لها تشبعات كبيرة على عاملین» وهذا يطرح تساؤلاً Loc‏ 
إذا كان محك البناء البسيط يحقق الحل المكتوب بالتقرير. 

T‏ سدق أنه من غير الناسب القول ls‏ الفقرات غير مشبعة بالعامل الأرلء 
وبالتالي الإدعاء أن الفقرة 13 لها تشبع 0.47 غير مشبعة بالعامل الأول. 
لاحظ تشبعات الفقرات 14 ,19 ,22 على العامل الثاني. 














الفصل الرابع عشر 


%50 للأعلى وأدنى‎ 0.00 = 21-1 A 
0.40 = D2 فقرة‎ 
%30 لأعلي وأدنى‎ 0.33 = DI فقرة‎ 
0.67 = D 
في المقام).‎ N الكلي باستخدام‎ Pe [rn 03-1 رم‎ ee 
0.66 2 فقرة‎ 
018- 1 ج فقرة‎ 
052 5 
التخیر التي تقیسه الفقرة توزیعه‎ of د- یتطلب ارتباط بایسیریال افتراض‎ 
“gilt طبيعي. ومع ارتباط بایسیریال یکون التوزیع‎ 
23 آ- فقرة‎ /2 
ب- عبر الذين كانت إجاباتهم صحيحة على الفقرة 25 حصل معظمهم على‎ 


A E‏ ينك ارف Bees OP eal‏ الذيق كانت 


ج- إعادة كتابة الاستجابة 2 کی تصبح أكثر جاذبية ومنطقية للذين ليسوا 
متأكدين من اجاباتهم. 

د- قد يكون هنالك SUS‏ فى الفقرة ( يجب أن تكون الاجابة الصحيحة 4 وليس 
3 آو of‏ هنالك Lagat‏ بالکلمات المستخدمة فى نض الفقرة أو البديل 3 مما 


ه- ل 24 066 
ل 25 0.52 

وت 015 

و 0.625 
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3 1- اختبار مريع كاي للاستقلالية = 33.93 لذا يوجد علاقة دالة إحصائياً. 

ب- مربع كاي لعينة كبيرة ۱۲,۲۰ لذا يوجد فروق دالة إحصائياً بين صعويات الفقرات. 
oe 3-1 /4‏ ج- 2 Sia‏ ه 4 

013 دس‎ B37. ofS 


الفصل الخامس عشر 
p,,(8,) A‏ -0.00 
0.00=p,(@), , 100=p, (0),‏ 
@,)=P,,@),‏ ,م (ر 0,66 
لي 8 > 98> ,0) ووم = 0.00 
).0< 8 > ,0( رم = 1.00 
p, (0, <0 >‏ = 0.00 
(0) ورم = )8( وم )0( رم لكل ,8 > 6< ,9 
E‏ وتو 
لكن )8( =0.7x0.5 = p, (8) p,‏ 0.35 
p(+, +A)‏ )0( ,م( 0) رم ء ويما أن الفقرات ليست مستقلة محلياً فإنه لا 


يكون أحادي البعد. 
7 يشير نمط الاستجابات إلى أحادية البعد. وكذلك فان المنحنيات المميزة للفقرة: 
ACCS)‏ دوال خطوة. 


0.44 , 0.58 , 0.75 , 1.33 = ag /4 


1.31- , 1.05- , 0.87-, 0.66- = bg 
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[- الفقرات 7۰4 ۰ 15 غير مشابهة في تمييزها لمعظم الفقرات في الاختبار 
(لاحظ أن معامل ارتباط بوينت بایسیریال متطرف مع درجة الاختبار الكلية). 
ب- فقرة 1 تبعد كثيراً للمجموعة 4 
فقرة 3 تبعد كثيراً للمجموعات 6-4 
فقرة 4 تبعد كثيراً للمجموعة 1 
ج من الأسهل إلى الأصعب 1 ,3,4 
د- 9.0 ,10.77 
Ls- 20 ð‏ -10 -05 00 15 10 15 20 


0.88 1.03 1.15 1.22 1.24 1.22 1.15 103 088 A 
0.81 7.08 1.35 1.53 162 1.53 1.080 0.81 B 
يمكن تعديل الصعوية على مدى واسع فقط في حالة کون التمييز عالياًء ومع ذلك‎ 
الكامنة لهم في منطقة وسط توزيع الصعوية.‎ 


الفصل السادس عشر 

0.385 , 0.364 , 0.537-, 1.738 , 2.121 , 0.832- , 0.64 للفقرات هی‎ dg 
لها كثيراً عن‎ d والفقرات 3 و 7 تختلف قيم‎ 0.446- , 0.310, 0.308, 
لذا پیدو آنها متحيزة.‎ ecg AY! الفقرات‎ 

=X?‏ 1.40 وهذه ليست ذات دلالة إحصائية 

X?‏ = 0.76 وهذه ليست ذات دلالة إحصائية. 

باستخدام الفقرات 12-5 ,15-13 ,16 ,17 ,18 ,19 ,20 ,23-21نحصل على 
تکرارات متوقعة تحقق الحك البین في هذا الفصل. ولحصائي ”× لهذه 
ol, a al‏ هو 0.3 ,0.164 ,3.358 ,1.714 ,0.056 ,0.434 ,0.09 , 0.887 
ومجنوعها 15.507 


الأحصناكل Z‏ الفقرات الخمس عش هی 


== 5 



































0.43 , 1.27, 0.26 , 0.10-, 1.20, 1.44, 0.55, 0.93-, 1.13, 1.20, 0.65-, 0.15- 

,1.04 ومن هذه القيم إحصائي t‏ للفقرة 6 دال عند مستوى 0.05 ومع هذا فمن المهم تذكر 
أن 15 فقرة تم اختبارها لمعرفة تحیزها عند مستوى 0.05 وان كانت جميع الفقرات غير 
متحيزة في الحقيقة» فإن العدد المتوقع للاختبارات الدالة إحصائياً = 0.05 )10( = 0.75 


-A pico 


/1 


/2 


3 
/4 
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وحيث أن واحداً منها دال إحصائياًء لذا فمن المناسب اعتبار الفقرات الخمس عشر غير 


الفصل السابع عشر 


6,6,6,10,4 —í 
ب- المفحوص )3( لم يحذف فقرات وأجاب عن 5 فقرات خطاً.‎ 
Aba )حذف ۲ فقرات وأجاب عن فقرة واحدة‎ a) المفحوص‎ 
معامل الارتباط بين نصفي الاختبار وتصحيحه باستخدام معادلة سبیرمان-‎ 
براون.‎ 
ترتیب الفحوصین لا یتغیر فیما لو آجاب جمیع الطلبة عن جميع الفقرات.‎ 
1.8 زيادة وقت الاختبار من 50 إلى 90 دقيقة مکافی لزيادة طول الاختبار بنسبة‎ 
من طوله الأصلي. والثبات الحسوب للاختبار الطول 0.80 وهو آقل من الثبات‎ 
الذي نحصل عليه بالطريقة التجريبية.‎ 
لكل منهم.‎ 5.55 I 
WEE 
5.55 وت‎ 
4.95 ه-‎ 
3.94 ج-‎ 
4.44 و‎ 


4.44 a 




















الفصل الثامن عشر 





LIT /1 
28.9 /2 


Xg‏ = 5 النسبة هي الأكثر ضرورة. 


الفصل التاسع عشر 
^ 
أ- استخدم الصيغة yy‏ © = سح ل وذلك عند ١‏ = 20, واستخدم ۸۷ - 1 في المقام 
aie‏ حساپ قيمة © ( تتفیر الاجابات اعتماداً على الدرجات العشرون الختارة فى 
العینة). 
ب- اختر عشوائیاً أي فصلین من الفصول الخمستة. وصيغة الخطاً العیاری هی: 
1 ات 

: وفي حالة اختیار الفصلین الأول والثانی فان‎ OH 
١ Vk 





= Ou. 


1.55 = OM, 
ESE و 16 طالياً ليسوا من طلبة‎ ESE ج“ يجب أن تتضمن العينة 4 طلاب من طلبة‎ 


2/ أ منتظم ب- طبقي 


ج- على مرحلتین : طبقية وعنقودية 





100 3 


=== 7 


























الدرجة الخام | الرتبة المبنية | الدرجة الزائية | الدرجة المعيارية| الدرجة | الرتية المكدة 
x‏ الخام الخطية الزائية التائية | المعيارية ' 
5 


| وو‎ | 5 | a | 2 | o | 4s | 





5 . أ- كاثي كسبت أكثر في الترتيب المئيني. 
ea‏ یتضمن التساعي الرابم مدى أوسع من الرتب الثينية من التساعي الثاني. 
ج“ يفقد جون أكثر في الدرجات الخام. 
دحلا توجد علاقة خطية بين الأنواع المختلفة من التحويلات الخطية. 

































الفصل العشرون 


40.2 +(47.9-x)102=y* 1 


3 فيما يلي جدول تحويل الدرجات الخام على الصيغة (ب) إلى درجات سمة كامنة 





4/ الدرجات المعتمدة على درجات منفردة في الجزء الثاني يمكن تحويلها إلى تدريج 
الجزء الأول باستخدام المعاملة (1-20): ويحساب قيم d, ©, a‏ إلى باستخدام 
العاملات P20)‏ 20-ب» 20-ج)ء ويمكن إضافة درجات الفقرات المفردة إلى 
الدرچات العبر عنها في الجزء الأول لتكملة حل المسالة. 
ويالتعويض بالعادلات oda‏ نحصل علی: 

(1.511 - 2.934) 2(1.412) + 2 

(4.677 - 2.934)2 (1.881) + 36711 

1.27 = / 1.606 = a 

(4.300 - 4.250) 1.881 + 16.600 = © 
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16.51 = A 
17.07 = 4 
الخط المعياري للقياس هو:‎ 5 
فى ا‎ A 
: Pi? 1 02 
)/0.7 - 10 ( 10 - 
/ 0.3 10 = 
ولا يكون الخطأ المعياري للمعادلة أكبر من 10/1 من الخطاً المعياري للقياس. لذا فإن‎ 
المطلوية‎ N الخطأ المعياري للمعادلة - 1 (10 3/ = ۷/3للتصمیم 8 يمكن حساب قيمة‎ 
باستخدام المعادة (6-20) والتي تؤدي إلى:‎ 
)0.7-1( (100) 2 





[2 + (0.7 +1)5] 


ويحل العادلة N‏ = 40 


























